科技作家陈根谈国产ChatGPT：如何获得高质量数据是核心

【资料图】

文｜和讯科技张星钰

“Open AI公司至今没有公布它的数据到底来源于哪里，它背后是有强大的高质量数据支撑的”，在近日电子工业出版社主办、财联社鲸平台协办、悦悦图书承办的《ChatGPT:读懂人工智能新纪元》新书发布会上，该书作者、科技作家陈根博士发表如上观点。

ChatGPT，毋庸置疑成为2023年首个爆款。放眼国内，国内首款对标ChatGPT的产品、由百度打造的“文心一言”在近日正式现身；腾讯也在最新财报电话会议上确认将推出类ChatGPT聊天机器人产品，并披露相应进展；阿里巴巴曾传出类ChatGPT应用的对话截图；火热的AIGC概念之下，多家上市公司也先后发声将推出相关产品或应用。

尽管如此，陈根指出，目前国内阿里、京东、腾讯、百度等企业虽然也在做类似ChatGPT的产品，但也面临着一些挑战，从硬件层面来说，核心的挑战可能是算力。再有就是数据层面，比如说，微信每天都会产生大量的数据，但是大部分都是无效数据，因为只有高质量的数据才能够重复训练。所以，对于这些企业而言，如何获得高质量数据便成了核心。

科技作家陈根

“所有行业都将被重塑，人类社会将被重新定义，这是一个充满着无限商业机会的时代”，基于ChatGPT具备的能力、发展进程、核心要素等方面，陈根如此判断。

陈根也同时指出，现阶段没有必要去讨论“人和人工智能必有一战”这种概念，以ChatGPT为代表的人工智能技术本身是中性的，技术的背后是人类给它传输的数据，与其担心未来人与人工智能是否会发生矛盾，不如现在去反思我们应该给它导入什么样的数据？赋予它怎样的价值体系？这个反而是更重要的。

陈根称，任何一项新技术在发展的初期都会存在很多问题，但随着人和技术的不断磨合，人类对于技术的鉴赏能力也会逐步提升，在这种磨合的过程中，可以不断推动我们去建立一个更严谨的价值体系，最终助力人工智能技术产生更有价值的信息。

关键词：