科技作家陈根谈国产ChatGPT:如何获得高质量数据是核心
【资料图】
文|和讯科技 张星钰
“Open AI公司至今没有公布它的数据到底来源于哪里,它背后是有强大的高质量数据支撑的”,在近日电子工业出版社主办、财联社鲸平台协办、悦悦图书承办的《ChatGPT:读懂人工智能新纪元》新书发布会上,该书作者、科技作家陈根博士发表如上观点。
ChatGPT,毋庸置疑成为2023年首个爆款。放眼国内,国内首款对标ChatGPT的产品、由百度打造的“文心一言”在近日正式现身;腾讯也在最新财报电话会议上确认将推出类ChatGPT聊天机器人产品,并披露相应进展;阿里巴巴曾传出类ChatGPT应用的对话截图;火热的AIGC概念之下,多家上市公司也先后发声将推出相关产品或应用。
尽管如此,陈根指出,目前国内阿里、京东、腾讯、百度等企业虽然也在做类似ChatGPT的产品,但也面临着一些挑战,从硬件层面来说,核心的挑战可能是算力。再有就是数据层面,比如说,微信每天都会产生大量的数据,但是大部分都是无效数据,因为只有高质量的数据才能够重复训练。所以,对于这些企业而言,如何获得高质量数据便成了核心。
科技作家陈根
“所有行业都将被重塑,人类社会将被重新定义,这是一个充满着无限商业机会的时代”,基于ChatGPT具备的能力、发展进程、核心要素等方面,陈根如此判断。
陈根也同时指出,现阶段没有必要去讨论“人和人工智能必有一战”这种概念,以ChatGPT为代表的人工智能技术本身是中性的,技术的背后是人类给它传输的数据,与其担心未来人与人工智能是否会发生矛盾,不如现在去反思我们应该给它导入什么样的数据?赋予它怎样的价值体系?这个反而是更重要的。
陈根称,任何一项新技术在发展的初期都会存在很多问题,但随着人和技术的不断磨合,人类对于技术的鉴赏能力也会逐步提升,在这种磨合的过程中,可以不断推动我们去建立一个更严谨的价值体系,最终助力人工智能技术产生更有价值的信息。
关键词: