当前简讯:数字健康|ChatGPT火爆出圈多模态AI通用技术高速迭代 医疗健康“数据源”问题如何破解?
2023-05-16 13:54:29 来源: 21世纪经济报道
当前,多模态AI通用技术正在高速迭代。ChatGPT火爆出圈,颠覆人们对AI能力的认知。近日,在“讯飞星火认知大模型”发布会上,科大讯飞董事长刘庆峰从7个维度演示了星火大模型的通用能力,以及大模型与讯飞现有产品结合的商业应用成果,其中也包括其在医疗领域的探索。
实际上,在产学研多方努力下,全球智能时代加速到来,医疗健康行业也正加速进入数智化的爆发期。据知名市场调研公司Report Linker最新报告数据显示,全球医疗保健AI市场规模预计从2023年的146亿美元,增长到2028年的1027亿美元,年复合增长率达47.6%。
如何在GPT大潮中准确把握机会?在近期的一次座谈会上,智云健康CPO、副总裁杨文琳的回答是:“我们首先要上船,水涨船高之后船就起来了。”
【资料图】
目前,无论在医疗领域还是医药领域,GPT技术都有较多的应用场景。如在医疗领域,包括问诊、报告解读、辅助诊断、知识问答方面辅助医生临床决策,帮助医生提高效率等;在医药领域,GPT对药物研发方面也有一定推动和影响,包括GPT可以识别分子,可以转化成计算机语言能够识别的SMILES格式等。
不过,如硬币的两面,在GPT等AI技术带来的助推,另一方面也会有一定的“隐患”。如5月2日,被称为“人工智能教父”,开发了ChatGPT等聊天机器人的杰弗里·辛顿博士宣布从谷歌离职,并对他长期推崇的这项技术的风险发出警告。3月29日,1000多名技术领袖和研究人员签署了一封公开信,信中呼吁:所有AI实验室立即暂停比GPT-4更强大的AI系统的训练至少6个月。
据了解,目前国家网信办发布的《生成式人工智能服务管理办法(征求意见稿)》也正在征求意见中。据参与讨论的宁人律师事务所合伙人、律师马军向21世纪经济报道记者透露,其中争议比较大的问题主要是数据来源的真实性、准确性等问题,部分还有一些有严重的政治问题。“需要解决数据合规性问题,需要进行数据清洗。综合来看都会清洗掉20%到40%的数据。”
颠覆?辅助?
GPT技术对NLP(自然语言处理)方面的巨大突破尤其在需要进行文字、语言交流方面有着广阔的前景。
“人工智能是‘人工的’智能,有多少人工就有多少智能。”杨文琳回忆2013、2014年许多医疗大数据公司发展起来的历程。当时自然语言识别和标识存在着很多问题,数据的清洗、治理、标注、补充非常困难,搭建数据库一年成本都要几个亿,医疗领域大量数据都“停留在医生的抽屉里”,没有数据化。
GPT技术崛起后,全新的大模型学习方式取代了传统的分词方式,工作量和所需数据量大幅减少。
高效的Transformer架构、非常大规模的数据模型、自监督的训练方式结合起来促成了GPT的成功。GPT技术具有多任务的通用性,同时可以以小成本进行学习,并学会“推理”,进行举一反三。通过大模型与别的流程和设备进行对接的“大模型+X”范式,可以简化大量流程,减少企业雇员成本。根据不同的专门需求,喂养GPT更偏重于医学的专业领域知识,可以在保证准确率和经济型下建立专业GPT模型。
智云健康首席科学家刘晓华举例称,使用4个英伟达A800 GPU,4个小时就能做一个简单的医疗助手,评测效果与大模型平级,而所需要的参数数量仅占1/4,提升了经济性。
医药研发领域一直存在的“双十定律”,即“十年攻关、十亿美元投入”,在AI技术的协助下也可能发生重大转变。2023年2月,由生成式人工智能驱动的临床阶段生物科技公司英矽智能(Insilico Medicine)宣布,公司首款自主研发的抗特发性肺纤维化药物INS001_055即将启动II期临床试验。第二款抗新冠病毒口服创新药ISM3312已获得中国国家药监局的临床试验许可。
英矽智能仅花费18个月就找到了新的化合物,大幅度减少新化合物开发时间。这一成果鼓舞越来越多的药物研发企业开始引入人工智能开发虚拟筛选技术,以取代或增强传统的高通量筛选过程。
南开大学药学院教授、博士生导师林建平向21世纪经济报道记者分析称,GPT在反向分子设计,包括抗体、药物、蛋白的设计方面,需要通过生成模型产生新药的部分有很大潜力,可能替代传统技术。“GPT能够写很多程序,预测化合物针对癌症的活性,也可以在药物研发中给出化合物相应的性质,同时还可以对测试数据进行挖掘和整理;对生物医学领域文献的文本提取、关系提取都会比以往的模型更高效。”
数据整合交互、临床试验的数据核查也是GPT技术的强项。例如,搜集上来的患者临床试验数据存在着各种形态的非结构化资料,以前都需要人力进行整理,现在很多可以靠GPT技术自动化归纳。AI协助下的临床数据的远程核查和翻看也可以降低人工干预的成本,提升患者管理的效率。由于机器对文献的理解深度广度远高于一般的写方案的人,撰写临床试验方案上,机器也能帮助企业高效地写出相对科学性高、符合监管机构的要求,同时也符合实际情况的方案。
此外,经过专门训练的GPT不仅能回答知识性问题,还能参与到需要情感理解的心理治疗。北京大学第六医院临床心理科主任黄薛冰以北医三院与科技公司研发的“北小六心理咨询师”举例称,“北小六”能根据对话中相关关键词进行分类,提供对应精神治疗方案,涵盖诊断、治疗、干预的心理治疗全程,相比真人治疗师,机器治疗的胜任力相当不错。中国现在心理健康医师存在很大缺口,GPT能够为患者提供预咨询,处理轻症和长期回访任务,担任治疗师的助手,甚至能当老师,带领经验不足的治疗师。
合规问题凸显
在GPT掀起的热潮中,也有业内人士等提示其所带来的潜在风险,各国监管机构都开始制定相应的规章制度。
如4月11日,国家网信办发布的《生成式人工智能服务管理办法(征求意见稿)》也引发了高度关注,其中也引发不少争议。马军向21世纪经济报道记者列举了其中争议比较大的问题:现在数据集有的使用国内数据,有的使用国外数据,国外数据相对真实性、准确性、多样性较高,但很多数据都来自于媒体,政治意识色彩浓厚,数据合规性存在问题,需要进行数据清洗。综合来看都会清洗掉20%到40%的数据。
大数据时代,数据成为了新时代的“富矿”,拥有数据的各方都不愿意无偿将自己的数据共享。尤其是医疗机构之间,信息化壁垒很强,各大医院之间的数据打通非常困难。杨文琳向21世纪经济报道记者介绍了其多年前在基金会协助下建立的联盟项目,将十家医院的肺癌、胸外科和肿瘤科半年的数据进行开放,十家医院的团队都可以访问调取数据。在电子病历的监控上有一定作用,但更多的应用遇到了很大问题,即使通过国家卫健委的行政手段都不一定能够拿到很多医院的数据。
为解决“数据孤岛”问题,北京市计划建立大模型、高质量的数据库,让大厂和医院统一接入,从而避免意识形态问题,提升数据整理效率。中国体制和欧美国家不一样,中央政府、地方政府、国企央企牵头可以建立一些基础性集中性的数据资源平台和基础设施,促进医疗GPT的学习和发展,这项工作还需要更多企业单位进行配合。
征求意见稿第四条还规定:利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。医药行业真实性要求很高,需要数据库及时更新修正。例如药物阿瓦斯汀(Avastin)的乳腺癌适应症已经被取消,而GPT回答问题时会给出错误的答案。如果设计医疗对话机器人,也需要防止GPT虚构引用文献和资料。
OpenAI所使用的数据以书籍和杂志为核心,没有使用生物医药数据进行训练,所以ChatGPT在医药健康领域表现不是很好,未来能否增加这方面的数据也存在很多挑战。因为数据的原理、质量、预训练模型不同,直接接入数据生成生物健康内容会产生很多错误。
从医疗全方位来看,预防、康复、患者管理三方面应用的前景很好,而且已经得到了很多的应用,但在临床环节,涉及到管理内容特别多,实际推行存在很大困难。北医六院信息化建设办公室主任孙世伟认为,在监管、患者和医务人员三个层面都有相应的问题需要解决。监管方面需要获得政府部门的准许,患者的满意度,对疗效的期望都很复杂。速速科技CEO吕宁表示,用机器人的方式和患者进行长期随访的效果很不理想,患者如果意识到对方是一个机器人,产生反感度非常高,更多还是辅助工作人员提升工作效率。最后,很多医务人员都感到“很多科技公司跟我来谈是训练模型,结果是来取代我”,不愿意推广,还需要企业在宣传上考虑到使用者训练者的感情。
(文章来源:21世纪经济报道)
标签:
为您推荐
精彩放送
热门文章
-
城商行理财公司现金类产品七日年化收益率榜单(截至5月11日) _前沿热点
-
南财研选快讯丨东莞证券:市场流动性充裕 预计大盘有望震荡修复
-
滚动:金冠股份:截至目前光伏逆变器订单正在开拓中,尚未形成销售收入
-
农业银行:截至4月末粮食重点领域贷款增量和增速均创近年新高
-
中字头板块震荡走弱 中国高科跌停 头条
-
环球头条:隔夜SHIBOR报1.4760% 下降4.70个基点
-
央行:硅谷银行破产对我国金融市场影响可控 _微动态
-
达华智能:公司BRSAT-1卫星已完成全部卫星技术部分论证并固定相关技术附件
-
全球快讯:国家统计局:4月份主要生产需求指标同比增速回升明显 积极因素增多
-
世界观热点:工信部召开安全应急产业发展政策座谈会
-
山西:加速“烟火气”回归,持续开展“晋情消费·品质生活”系列促消费活动
-
国家统计局:相关部门正积极出台政策帮扶青年人就业难问题
精彩图片
-
成本大减!新一轮的旗舰大战也将在即将到来的9月正式拉开帷幕
-
博览会开幕 中国首款具有自主知识产权的国产通用型科学计算软件正式发布
-
技术下降!Intel独立显卡驱动一次评测就发现43个Bug
-
高性能的台式机彻底告别“光污染” 雷克沙推出简洁纯白外观设计
-
韩国媒体率先报道:三星电子236层NAND闪存预计年内开始生产 市场竞争更激烈
-
新科技!苹果正在积极研发某种形式的AR/VR头显或智能眼镜
-
谷歌测试开展新功能 向用户展示哪些云流媒体服务拥有特定的视频游戏
-
支付宝积极响应国家为小微降费的政策号召 一年降费让利近80亿
-
京东汽车就与浦林成山旗下新能源车轮胎品牌浦林达成战略合作 助力轮胎“电动化转型”
-
苹果新专利公布:暗示未来 iPhone手机或许有陶瓷材质版
-
盖茨和韩国能源供应商SK共同牵头 其中SK投资2.5亿美元
-
海底捞早已经捞不动了 据统计上半年最高亏损达2.97亿
热文
-
充电桩板块反复活跃 北巴传媒2连板 天天新要闻
-
花十万可以买八套房的鹤壁 真实的楼市是什么境况? 天天播资讯
-
南财研选快讯丨天风证券:水泥行业基本面改善存在超预期可能 全球视讯
-
富春股份:已搭建本地化AI应用工具 实现一定的降本增效 _每日快报
-
南财研选快讯丨银河证券:国内家电消费有望逐步复苏 关注三条投资主线
-
亚太股份:目前公司与特斯拉暂未签订相关合同 环球信息
-
抗阿尔茨海默病“第二人”出现 |最新快讯
-
炸锅!存款一夜归零,这家银行再爆猛料!只保护美国储户?拜登被要求做认知测试,62名议员联合发声|环球聚看点
-
拿稳"接力棒"跑好"接力赛" 厦门第八、九批援疆干部人才完成工作交接 每日聚焦
-
当前消息!《催收标准》业内征求意见 金融业能否告别暴力催收?
-
天天微动态丨中信证券:家居震荡上行可期 纸基利润拐点将现
-
普通文件柜密码锁怎么开_文件柜密码锁怎么开
-
高质量建设光明科学城南部产业转化中心 白花科创谷“呼之欲出”
-
环球观热点:一季度高瓴HHLR再加码多只中概,拼多多成第二大重仓,华住晋升前十
-
天宇股份(300702):5月15日北向资金减持25.55万股
-
不宜夸大CPI阶段性回落影响 CPI增速或在二季度“触底”后温和抬升
-
焦点速递!存款利率调整旨在稳息差抑空转防风险
-
聚焦草根足球 2023年“亚足联-中国足协草根足球日”主会场活动举办|热推荐
-
主线任务开启!代号“天河行动”
-
香港中文大学(深圳)医学院举行开工奠基仪式
-
焦点热门:WiFi板块5月15日跌0.25%,平治信息领跌,主力资金净流出8.03亿元
-
小学六年级上册数学教学计划北师大版_六年级上册数学教学计划北师大版 快消息
-
蛇眉铜鱼画法 蛇眉铜鱼
-
国家发改委:促进民间投资持续健康发展 环球观热点
-
全球动态:大便出血什么症状也没有_大便出血什么症状
-
如何写个人简历_个人主要简历怎么写-天天报资讯
-
当前讯息:国家能源局:4月份全社会用电量同比增长8.3%
-
最资讯丨为高质量发展保驾护航 广东省公安厅经侦局联合南财集团等单位发起防范经济犯罪暖企宣讲
-
吕乐 焦点热议
-
魔兽世界冰封王座人物_圣骑士 《魔兽争霸III:冰封王座》中的角色-天天观察
-
5月华北现37℃高温是否异常?专家回应属正常现象
-
第十届中国畜牧科技论坛16日启幕!历届论坛硕果满满、亮点多多!_全球热闻
-
绿盟科技:担保总额为7.4亿元_全球热点
-
世界微资讯!央行:4月末上海人民币存款增加1215亿元 同比少增1084亿元
-
科大国创:拟定增募资不超过8.1亿元 _全球时讯
-
公积金政策再“松绑” 多地允许提取支付购房首付 |全球聚看点
-
南网储能:所属抽水蓄能电站容量电价核定 预计减少公司2023年收入预算4.96亿元 _全球微头条
-
*ST中天:公司股票可能被终止上市 |今日报
-
ST阳光城:实控人因龙净环保历史信披违规事项被立案
-
上海4月份人民币贷款余额10.15万亿元 同比增长10.4%|天天消息
-
埋首矿山做研究 踏实教书育英才
-
祸兮福之所倚福兮祸之所伏拼音 祸兮福之所倚福兮祸之所伏的意思 全球速递
-
焦点热文:天津发布《制造业高质量发展行动方案》 到2027年战略性新兴产业规模料突破1万亿元
-
男子拳击世锦赛落幕 中国队收获一枚银牌|环球热头条
-
经纬纺机:与国机租赁、国机保理签署战略合作框架协议 -全球热消息
-
今日看点:“阳光红300红利增强”逆势走强,一季度重仓能源板块资产|机警理财日报
-
山东港口青岛港_环球速读
-
广东前4个月出口增长5.4% 世界即时看
-
恒瑞医药:拟以6亿元-12亿元回购股份
-
粤泰股份股票异动 5月15日收盘价跌至0.90元/股