添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

时间 :2023年10月12日(本周四) 09: 30

地点 :望江校区基础教学楼B座318实验室

成员 :王启鹏、杨璐歌、甘霖、管弦、蒋林呈、阳斯敏

本周论文研读主题为 顶会论文写作分享

Part1

分享者 :王启鹏、杨璐歌

分享内容 :Lin, Y., Li, H., Yang, L., Wu, A., & Qu, H. (2023). Inksight: Leveraging sketch interaction for documenting chart findings in computational notebooks. arXiv preprint arXiv:2307.07922 .

论文简介 :计算笔记本能够在单个文档中支持数据探索和解释,因此在探索性数据分析中越来越受欢迎。在探索过程中用有效的文档解释图表结果至关重要,因为这有助于回忆和分享数据分析结果。然而,由于耗时且繁琐,记录图表结果仍是一项挑战。现有的自动方法虽然减轻了用户的部分负担,但往往无法满足用户的特定兴趣。针对这些局限性,我们推出了 InkSight,这是一款混合型计算笔记本插件,可根据用户的意图生成查找文档。InkSight 允许用户通过在顶端可视化草图直观地表达他们对特定数据子集的意图。为此,我们设计了两种草图,即开放路径草图和封闭路径草图。收到用户的草图后,InkSight 会识别草图类型和相应的选定数据项。随后,它会根据草图和所选数据项过滤数据事实类型,然后再利用现有的自动数据事实推荐算法来推断数据事实。InkSight 使用大型语言模型(GPT-3.5)将数据事实转换为有效的自然语言文档。用户可以方便地在 InkSight 中对生成的文档进行微调。一项有 12 人参与的用户研究表明,InkSight 在表达用户意图和促进图表查找文档方面非常实用和有效。

Part2

分享者 :甘霖、管弦

分享内容 :Xingqi Wu, Yi Shi, Minghui Wang, Ao Li ,CAMR: cross-aligned multimodal representation learning for cancer survival prediction. Bioinformatics, Volume 39, Issue 1, January 2023.

论文简介 :准确预测癌症生存对于帮助临床医生计划适当的治疗至关重要,这大大提高了癌症患者的生活质量,并节省了相关的医疗成本。生存预测方法的最新进展表明,整合来自不同模式的互补信息,如组织病理学图像和基因组数据,在提高预测性能中起着关键作用。尽管现有的多模态方法取得了很好的效果,但多模态数据的不同和异构特征导致了所谓的模态差距问题,这给特征空间中的模态表示带来了截然不同的。因此,有害的模态差距使得通过表示学习全面整合多模态信息变得困难,因此对癌症生存预测的进一步改进提出了很大的挑战。为了解决上述问题,作者提出了一种名为交叉对齐多模态表示学习 (CAMR) 的新方法,该方法生成模态不变和特定表示,以实现更准确的癌症生存预测。具体来说,引入了一种跨模态表示对齐学习网络,通过有效地学习公共子空间中的模态不变表示来减少模态差距,这是通过对抗训练对齐不同模态表示的分布来实现的。此外,作者采用跨模态融合模块将模态不变表示融合到每个患者的统一跨模态表示中。同时,CAMR 学习特定于模态的表示,这些表示补充模态不变表示,从而为多模态数据提供整体视图以进行癌症生存预测。综合实验结果表明,CAMR 可以成功地缩小模态差距,并且始终比使用多模态数据的其他生存预测方法产生更好的性能。

Part3

分享者 :阳斯敏、蒋林呈

分享内容 :Wang A, Chen H, Lin Z, et al. RepViT: Revisiting Mobile CNN From ViT Perspective[J]. arXiv preprint arXiv:2307.09283, 2023.

分享内容 :最近,轻量级视觉 Transformer(ViTs)在资源受限的移动设备上展现出了相比轻量级卷积神经网络(CNNs)更优异的性能和更低的延迟。这种改进通常归因于多头自注意力模块,使得模型能够学习全局表示。然而,轻量级 ViTs 和轻量级 CNNs 之间的架构差异尚未得到充分的研究。在这项工作中,本文重新审视了轻量级 CNNs 的高效设计,并强调了它们在移动设备上的潜力。本文通过集成轻量级 ViTs 的高效架构设计,逐步增强标准的轻量级 CNNs,具体为 MobileNetV3 [1] 。最终,获得了一系列新的纯轻量级 CNNs,即 RepViT。实验表明,RepViT 在各种视觉任务中优于现有的最先进的轻量级 ViTs,展现出了优秀的性能-延迟平衡。在 ImageNet 上,RepViT 首次在 iPhone 12 上延迟接近1ms的情况下达到了超过 80% 的top-1精度。最大的模型RepViT-M3 只需 1.3ms 的延迟即可达到 81.4% 的 top-1 精度。