综合新闻

seabet Esports钱昆教授接受BIOI 独家访谈

近日,seabet钱昆教授接受了BIO Integration期刊的专访:

人物介绍钱昆教授于2018年获得德国慕尼黑工业大学电气工程和信息技术博士学位,后于日本东京大学进行了近3年的博士后研究。2021年担任seabet Esports教授。他的研究方向广泛,包括计算机听觉、情感计算、脑科学、数字健康和可解释人工智能 (AI)。

专访资讯

01. 据我了解,您目前正在人工智能相关领域进行开创性的研究,您是怎么对这个领域感兴趣的?

钱昆:我研究计算机听觉已经10多年了。具体来说,我的研究重点是将最先进的计算机听觉技术应用于医疗。我真的很喜欢这个年轻、有前途的领域,因为我的第一个研究项目涉及用于评估睡眠障碍的打鼾声识别。我发现跨学科研究是非常具有挑战性和极具吸引力的工作。为了实现一个目标,我们需要建立一个庞大的知识库——不仅是必备的基本技能,还有前沿技术。来自不同背景的令人兴奋和勇敢的想法融合在一起,可以产生实现最终目标的新颖解决方案。上述经历激起了我的兴趣,因此我冒险进入了这个令人兴奋的领域。

02. 您能和我们分享一下您在这一领域多年研究过程中的一些重大突破吗?

钱昆:我想分享两篇最近发表的论文。 我们的身体发出的声音携带着关于我们身体和心理健康的有价值的信息。近十年来,人体声音分析领域取得了重大进展;然而,对公开可用数据库的有限访问阻碍了这一领域的可持续研究。为了解决这一问题,我们在一项研究[2]中介绍了VoB (Voice of the Body)档案,作为一个公共平台,用于传播、交流和启发关于身体声音分析新兴技术的新想法(图1)。我们旨在组织一系列的挑战,以促进使用提出的VoB来发展以声音为驱动的医疗保健方法。我们希望以此打破不同学科之间的隔阂,为音频智能丰富的医学4.0铺平道路。

图1 身体的声音分析概述(Qian et al. Cyborg and Bionic Systems, 2023)

另一项涉及抑郁症识别的研究中,语音信号因其方便和易于获取而被普遍使用(图2);然而,由于缺乏相关语音和基准研究的公开数据库,关于使用语音识别识别躯体化障碍的研究有限。为了填补这一研究空白,我们与深圳大学总医院合作开发了深圳躯体化语音语料库(SSSC)。SSSC是一个可公开访问的语音数据库,用于躯体化障碍识别。同时还提出了使用经典声学特征和机器学习模型的SSSC基准[3]。我们的基准测试的最佳结果是通过具有共振峰F1-F3的支持向量机实现的,并且具有76.0%的召回率。SSSC的开发填补了躯体化障碍识别方面的研究空白,并为研究人员提供了一个有价值的公开访问语音数据库。基准测试的结果也证明了在躯体化障碍中使用计算机听觉进行语音识别的科学有效性和可行性。

图2 精神障碍的诊断方法 (Qian et al. Intelligent Medicine, 2023)

03. AI融入基础和临床研究的瓶颈是什么?您觉得研究道路上的主要绊脚石是什么?

钱昆:在这个人工智能时代,特别是深度学习,模型总是“渴望数据”。然而,几乎所有的医学领域,数据稀缺都是不可避免的挑战。在我的研究中,缺乏足够的数据(尤其是带标注的数据)是需要克服的主要障碍。此外,跨学科的课题往往需要不同知识和专业背景的成员共同努力,如何让所有成员充分理解共同的目标,保证高效的团队合作环境是另一个问题。

04. 您的一些研究是否已应用于临床或正在进行临床试验?“从实验室到临床应用”的过渡需要哪些准备?您会建议其他科学家也这样做吗?

钱昆:将我们开创性的想法应用于临床实践是我们一直追求的目标。事实上,我们正在努力使我们的研究结果在临床中被接受和采用。然而,“实验室到医院”的过渡是漫长的。值得注意的是,在人工智能相关的医疗应用领域,必须考虑伦理问题。对促进“实验室到医院”这一目标的努力不仅来自科学家,还应该来自政策制定者、临床专家和企业家。科学家应该记住,“从实验室到医院”的过程需要团队合作,我们应该与所有拥有相同目标的人合作。

05. 您对年轻一代的科学家们有什么建议吗?

钱昆: 我认为自己是当今年轻一代科学家的一员,像历史上所有年轻一代的科学家一样,我们在职业生涯的早期阶段面临着许多挑战。我们必须申请有竞争力的研究基金来支持我们的团队;我们需要平衡工作和家庭。最重要的是,我们永远不要忘记做研究的最初动机。对未被发现的领域的好奇心和拓宽人类知识疆界的梦想,总能激励我们在探索科学的道路上克服困难。此外,我们应该始终保持开放和谦虚,不仅向资深科学家学习,而且向年轻甚至更年轻一代的科学家学习,这有助于我们的思想保持年轻。

06. 您对BIO Integration这个新兴的期刊有什么发展建议吗?

钱昆:在我看来,BIO Integration开了一个好头。作为一个新兴的跨学科学术期刊,如何保证稿件的高质量始终是首要任务。同时,还可以考虑一些建议。首先,我们可以寻求与一些知名会议合作的机会。我们希望这些会议中的一些优秀论文可以扩展并推荐给BIO-Integration,以供可能的发表。其次,我们可以请一些顶尖科学家帮忙整理一些特刊,收集某个特定领域的优秀作品。最后,吸引更多的编辑成员(包括年轻成员)可以为这本新兴期刊的快速发展做出贡献。

【参考文献】

[1] Phei Er Saw. Voice Series: Interview with Professor Dr. Kun Qian, School of Medical Technology, Beijing Institute of Technology, China. BIO Integration 2023. DOI: 10.15212/bioi-2023-0009

[2]Kun Qian, Bin Hu, Yoshiharu Yamamoto, and Björn W. Schuller, The Voice of the Body: Why AI Should Listen to it and an Archive, Cyborg and Bionic Systems, vol.4, no.5, pp.1-3, 2023.

[3]Kun Qian, Ruolan Huang, Zhihao Bao, Yang Tan, Zhonghao Zhao, Mengkai Sun, Bin Hu, Björn W. Schuller, and Yoshiharu Yamamoto, Detecting Somatisation Disorder via Speech: Introducing the Shenzhen Somatisation Speech Corpus, Intelligent Medicine, in press, pp.1-13, 2023.

HTML MAP|XML MAP|TXT MAP