(相关资料图)
红刊AI快讯:有投资者在投资者互动平台问:为进一步推动我国大模型技术创新发展及工程化应用落地,中国信息通信研究院现启动大模型技术及应用基准构建工作,针对当前主流数据集和评估基准多以英文为主,缺少中文特点、文化以及难以满足关键行业应用选型需求等问题,联合业界主流创新主体共同构建一套涵盖多任务领域、多测评维度的基准及测评工具AISHPerf-LargeModel,推动我国大模型技术及应用的引领创新。请问贵公司是否参与?
中文在线(300364)03月29日在投资者互动平台表示:尊敬的投资者,您好:中国信息通信研究院表达当前主流数据集和评估基准多以英文为主,缺少中文特点等问题。公司深耕文化数字产业20余年,拥有海量的正版中文数据资源,同时也在为全市场的中文电子数据提供存证服务,使用公司自研的区块链国密算法+哈希值校验+区块链的技术手段,实现结果秒级上链实时核验,可为创作者快速确权。公司通过旗下各平台经过多年积累拥有海量的内容,品类除网络文学作品,还有大量出版物涵盖科普类、社会类、经管类、法律类,教育教材类等等,中文文字字数已超10000亿字,全品类的内容可为模型提供更好的语言场景训练,提升模型的语言能力;并且公司拥有旗下数字内容从数字版权到全部版权的权利,可为AI模型公司提供拥有版权的数据集用于训练。同时公司拥有的数字内容经过市场长期校验,已形成高质量的中文数据内容库,而高质量的数据可大幅提升模型训练效果,缩短学习时间和提升学习质量,让AI模型产出内容稳定;未来,公司将会充分发挥公司的中文数据优势,与国内各类模型主体合作,持续为行业赋能。