0次浏览 发布时间:2025-04-03 09:43:00
中国甘肃网4月3日讯 据甘肃日报报道(新甘肃·甘肃日报记者 苏家英)西北师范大学联合甘肃简牍博物馆近日推出DeepJiandu数据集,这是国际首个专门用于简牍字符检测与识别的大规模数据集。数据集包含了7416张简牍文物(文献)图像,并从中标注了99852个简牍字符,涵盖了字迹清晰、字迹模糊、字迹完整、字迹残缺等多种形态特征的2242种字符类别,可以运用于极具挑战性的简牍字符识别任务场景。
简牍承载着丰富的文化内涵与历史信息。然而,简牍因材料脆弱以及埋藏环境等影响,存在字符模糊、字迹缺损、布局复杂等问题,使得人工识别与整理极为困难。现有的文献数字化技术,虽在甲骨文、蒙文手写体等领域取得突破,但在简牍字符识别方面仍缺乏高质量的数据集,制约了深度学习应用。
DeepJiandu数据集的构建,正是为了解决这一问题。西北师大张强教授团队基于已有的红外图像资料,从中筛选出7416张高质量红外图像,通过对图像进行清理、噪声去除等,增强了字符的可辨识性,提高了字符墨迹的清晰度。在此基础上,由简牍学专家与计算机专家合作,使用目标检测标注工具,对涵盖2242种字符类别的99852个字符进行了手动标注,并提供了字符定位和类别标注,确保了数据的专业性与准确性。该数据集的设计,还充分考虑到简牍字符残损和异形字等复杂场景,有效提升了模型对历史文献的适应能力。
“DeepJiandu数据集的发布,标志着我国简牍智能化研究取得重要进展,将提升考古学者对简牍文献的解读效率,为历史文献OCR技术突破提供数据资源,为多模态文化遗产保护提供技术路径。”西北师大简牍学首席专家张德芳表示。
据了解,DeepJiandu数据集已载入西北师大简牍学术资源数据共享平台。目前,该平台开发了实物库、释文库、字形库、著录库、文献库和专家库六个库,利用人工智能、大数据分析、虚拟现实等先进技术,完成了对4万枚西北汉简的数字化收录,不仅为专家学者提供了便捷的研究工具,也向公众展示了简牍文化的独特魅力。该平台现拥有千余名国内外在线用户,覆盖国内外384个科研、文化机构和高等院校。
来源 中国甘肃网
夯实全国统一大市场的法治根基 构建全国统一大市场,是以习近平同志为核心的党中央从全局和战略高度作出的重大决策。从颁布《公平竞争审查条例》、发布《全国统一大市场建设指引(试行)》,到印发《关于健全社会信用体系的意见》《市场准入负面清单(2025年版)》,建设全国统一大市场的法治基础更加坚实,法治助力全国统一大市场建设成效更加凸显。 2025-08-13 06:59:00
潍坊安丘公积金中心:“绿色通道” 助力贷款业务当日办结 大众网记者 孔婷婷 通讯员 高硕 潍坊报道“真没想到这么快!本来还在发愁赶不上合同约定时间,现在终于能安心了。”近日,市民马先生在拿到公积金贷款放款凭证时,难掩激动之情。据了解,马先生购房合同约定的付款期限即将到期,若不能及时办理公积金贷款,将面临违约风险。焦急之下,他向潍坊市住房公积金管理中心安丘 2025-07-28 15:49:00
1507份特色西甜瓜珍稀种质资源亮相高台 中国甘肃网7月26日讯 据甘肃日报报道(新甘肃·甘肃日报记者冯宝强)丝路绵延,瓜香飘溢。7月25日,由中国农业科学院郑州果树研究所、甘肃省农业科学院与张掖市高台县联合主办的高台县西甜瓜产销对接会、优异种质资源展示共享暨科技开放周活动开幕。来自全国30余家科研机构的专家、企业代表百余人齐聚一堂,通过种 2025-07-26 07:53:00
国家数据局:2025数博会将于8月28日至30日在贵阳举行 国家数据局副局长余英7月22日在2025中国国际大数据产业博览会新闻发布会上表示,2025数博会由国家数据局主办、贵州省人民政府承办,将于8月28日至30日在贵州省贵阳市举行。据介绍,本届数博会以“数聚产业动能 智启发展新篇”为主题,旨在全面展现数据要素与人工智能技术融合创新的最新成果,推动数据资源 2025-07-22 11:36:00
龙梅子2025《都说》巡回演唱会兰州站8月16日在兰州体育馆激情开唱 中国甘肃网7月9日讯 据兰州晚报报道 7月8日,“龙梅子2025《都说》巡回演唱会——兰州站”新闻发布会在兰州举行,发布会正式宣布这场音乐盛宴将于8月16日、17日在兰州体育馆激情开唱。作为华语乐坛最具辨识度的实力派歌手,龙梅子将在此次演唱会上倾情演绎多首脍炙人口的代表作。从《都说》到《爱情专属权》 2025-07-09 11:12:00