景联文科技推出大语言模型高质量教育题库数据集,包含3亿道试题!

时间:2023-08-29 18:16:17       来源:砍柴网

ChatGPT拉开了大语言题库和生成式AI产业蓬勃发展的序幕。据预测,到2026年,全球生成式AI计算市场规模将达到109.9亿美元。全世界教育科技公司扎堆接入GPT-4,大语言题库在教育领域中将获得更加广阔的应用前景和丰富的应用场景。

杭州景联文科技是AI基础数据行业的头部企业,推出巨量高质量教育数据库,题量总计3亿道,试卷总量180万套。所有数据均经过严格的挑题、录入、排查、筛重、解答、复核、校稿程序。

该数据库所有题目均提供word可编辑版本、json格式。基于LaTeX算法保证公式转写准确性和可读性,包括各种常见的数学符号和表达式。


【资料图】

K12题库,覆盖从小学到高中数学、语文、英语、科学、道德与法治、物理、化学、生物、地理、政治、历史、信息技术、通用技术等全部学科;

大学题库,覆盖大学英语、政治、法学、经济学、医学等学科;

职业题库,覆盖职业教育所有相关学科,公考、金融类,工程类,医学类等。

题库共计覆盖全国各地区300多个教材版本,包括人教版、北师大版、教科版、苏教版、鲁教版、冀教版等主流版本。

收录近14年以来中考高试题试卷,覆盖率高达95%,各地区名校试卷和模拟试卷收录总量达20万份。

试题属性包含学科、章节、知识点、题型、难度系数(不少于5种维度)、题类(中考题/常考题/易错题/压轴题等)、真题次数、试题来源(所属地区)、能力、解析等十余类;

试卷属性包含学科、教材版本、年份、地区、学校、年级、学期、试卷类型、来源、分值、难度系数、考试时间、命题人等十余类;所有学科考点覆盖率100%。

试题解析均获得授权,100%原创解析,解析维度包括专题分类、分析过程、考点解析、解答过程、教师点评等。

景联文科技专业的题目数据库,不仅注重理解数据库设计原理,还强化数据库设计技术。运用关系型数据库管理模板和非关系型数据库(NoSQL)结合来处理和存储海量的题库数据,利用大数据处理框架Hadoop和Spark进行高效的数据分析和处理,以支持大模型进行高效复杂的数据库操作。

景联文科技将该题库进行部分开源,共开源10万道教育题库供更多的企业体验、反馈。期望能为国内的大模型应用研发企业提供领先优势,抢占战略制高点。

免费获取请咨询景联文科技官网。

景联文科技|数据采集|数据标注

助力人工智能技术,赋能传统产业智能化转型升级

关键词: