http://www.chinalibs.net 2025/5/27
[作者] 安波,龙从军,赵维纳
[单位] 中国社会科学院民族学与人类学研究所
[摘要] 本发明涉及古籍处理技术领域,具体公开了一种面向汉藏双语古籍知识化方法与系统,所述方法包括:通过引入藏文扩词表与配套预训练任务,构建同时支持汉语与藏语的多模态大模型,使其具备跨语言文本处理与图像理解能力;利用多模态大模型进行版面分析,自动识别并区分古籍中的图片区域、汉文文本区域及藏文文本区域;识别出的汉语文本和藏文文本分别执行实体与关系抽取,提取出核心要素及其相互联系;将跨语言、跨模态的文本与图像信息统一映射到一个可查询的知识图谱中,形成对古籍内容的语义化与关联化描述。本发明不仅有效解决了汉藏双语混排所带来的识别难题,还大幅提升了自动解析与知识抽取的准确度和效率,推动了学术资源的继承与传播。
本发明涉及古籍处理技术领域,具体公开了一种面向汉藏双语古籍知识化方法与系统,所述方法包括:通过引入藏文扩词表与配套预训练任务,构建同时支持汉语与藏语的多模态大模型,使其具备跨语言文本处理与图像理解能力;利用多模态大模型进行版面分析,自动识别并区分古籍中的图片区域、汉文文本区域及藏文文本区域;识别出的汉语文本和藏文文本分别执行实体与关系抽取,提取出核心要素及其相互联系;将跨语言、跨模态的文本与图像信息统一映射到一个可查询的知识图谱中,形成对古籍内容的语义化与关联化描述。本发明不仅有效解决了汉藏双语混排所带来的识别难题,还大幅提升了自动解析与知识抽取的准确度和效率,推动了学术资源的继承与传播。
详情请下载:一种面向汉藏双语古籍知识化方法与系统.pdf
引用本文:
安波,龙从军,赵维纳.一种面向汉藏双语古籍知识化方法与系统[DB/OL].[2025-06-20].http://www.chinalibs.net/ArticleInfo.aspx?id=597916.
温馨提示:
如果您的作品引用了本文,请您发邮件(leisun@chinalibs.net )告诉我们,我们会给您一个小小的惊喜哟!
——【北京雷速科技有限公司】