AI新缀二十则 【缀多多】
第一则:契合集49+中历藏502(边缘相似度:0.70112)
第二则:合集27957+合补9513(边缘相似度:0.73946)
第三则:合集27773+合集28549(边缘相似度:0.81856)
第四则:合集27754+合集28903(边缘相似度:0.82835)
第五则:合集27083+合补5651(边缘相似度:0.93117)
第六则:[合补318正反+珠1425](林宏明缀)+合集17132正反(边缘相似度:0.91245)
第七则:合集6180+合集6114(边缘相似度:0.80349)
第八则:合补1810+合集7307(边缘相似度:0.72448)
第九则:合补1996+拼集54(边缘相似度:0.76865)
第十则:上博49003.250+合补2684(边缘相似度:0.86248)
第十一则:上博21569.37+合集17281(边缘相似度:0.60146)
第十二则:旅藏711+合集11609(边缘相似度:0.81967)
第十三则:[英藏1191+合补4108](李爱辉缀)+合补5679(边缘相似度:0.59545)
第十四则:合集7449+合集7106(边缘相似度:0.70238)
第十五则:北珍2523+合集6343(边缘相似度:0.67734)
第十六则:合补3923+合集13183(边缘相似度:0.78854)
第十七则:合集14749+缀续531(边缘相似度:0.74832)
第十八则:上博46456+合补3659(边缘相似度:0.75813)
第十九则:合补3927+合集6306(边缘相似度:0.61666)
第二十则:合集11759+合集15149(边缘相似度:0.86016)
附:AI驱动的甲骨文字检测和识别成果简介
(由缀多多团队研发)
文字检测和识别是人工智能的一个重要研究领域,甲骨文字的检测和识别具有自身特殊的困难,但也具有独特的价值。最近两年,河南大学张重生团队,与门艺老师、张新俊老师为代表的河南大学新生代甲骨文团队密切配合,从约八千幅甲骨拓本中提取了十二余万张单字图像,并以这些单字图像为依据,设计AI算法训练了自己的AI甲骨文字检测和识别模型。
图 1. 张重生、门艺团队合作开发的甲骨标注软件
图 2. 张重生、门艺团队合作开发的甲骨文校对软件
图3. 张重生、门艺团队研发的甲骨文定位算法的甲骨文字检测结果(之一)
图 4. 张重生、门艺团队研发的甲骨文定位算法的甲骨文字检测结果(之二)
通过技术人员与古文字专家的多轮沟通和优化,现有模型的定位精度能够达到约90%。而主要遗留的问题多为合体字检测,此种情况通过识别反向验证定位还将会有进一步改善。
在甲骨文字识别方面,所设计算法的整体识别正确率近90%。我们还将图像识别与推理算法进行了结合,根据空间关系和句序关系,基于甲骨原文进行自动推理,实现了对部分残字的识别,如图5所示。
图 5 张重生、门艺团队研发的甲骨文识别算法对甲骨文残字的推断与识别
AI甲骨文字检测与识别技术作用是多方面的。这些技术的发展将在甲骨文字信息化方面发挥基础性作用,既可以辅助甲骨文字编的编撰,又能对甲骨校重工作提供帮助,还能帮助专家和算法从残字角度进行缀合。
计算机永远是为人类服务的。 缀多多团队的首要目标,是协助古文字专家解决他们关心的问题,切实服务于古文字学者的研究工作,切实推动古文字研究的进步。AI缀多多、AI甲骨文字检测和识别成果的取得,离不开甲骨文学者的大力支持,尤其是莫伯峰老师和门艺老师的大力帮助。同时,我们也非常乐意贡献我们的技术,为更多古文字问题的解决,提供自己的技术支持。热忱欢迎古文学界的朋友与我们交流合作,把人工智能与古文字结合的工作推向深入。
缀多多团队核心成员:张重生、莫伯峰、门艺,及各自所在的团队
缀多多主要研发单位:河南大学&首都师范大学
联系方式:张重生,河南大学, 邮箱:cszhang@henu.edu.cn, 微信号:A13938613173
相关链接:
日新月异
從第一組綴合看,它及鄴32.4(京津3117),不遭雨的遭似都為「遭遇」之意。
第一則中的號碼“契合集52”應爲“契合集49”。
第六則中的“合集17132正”,林宏明先生曾以珠1425試綴其下方(《甲骨新綴第491例【替換原491例】[林宏明]》,2014年7月6日),地址:http://www.xianqin.org/blog/archives/4158.html
第14則,合集7106亦見北圖10065。
第17則,“綴集531”當為“綴續531”。第19則,合集6306亦見北圖10681。
感谢杨熠老师和展翔老师指出。我们将订正数字标注方面的讹误。
老师们好!请问之前“AI驱动的甲骨缀合 ——附新缀十则 [张重生]”
http://www.xianqin.org/blog/archives/14062.html文后回复中提及的几则缀多多新缀,有发表缀合图的计划吗?
谢谢陈琦老师关注。我们后续会有统一发表。
感谢老师回复。我只是学生而已,您客气啦!非常期待后续的发表!
第十七則章秀霞有不同的綴合,他曾將拙作綴續531加上合6268。綴多多與章綴在摺痕上看起來都很密合,然而綴多多的辭例上下較不相干,章綴雖然都有工方,但合6268是伐工,綴續531是目工方。因此很難判斷哪一則才是正確的綴合,大家可以探討看看。
第十三則的合補4108下方,李愛輝先生曾加綴英1191(2019.12.1)
第十五則合補5255的左側是骨邊,和合3467的左側應還殘去骨臼鋸角,在形態上未能密合。
第十六則從斷痕來看雖然密合,但是合5121底部看不到合10083的界畫,合10083上方也看不到合5121「往」字的末筆。合10083在骨版上的合理位置,應沒有本綴這麼高。
林先生的提法很值得注意。合10083彩照參北圖2560,從彩照中看,該版左上與合5121拼合處似乎確實未見“往”的橫畫殘畫。
感谢林老师和展老师的指正和帮助。缀多多软件还在不断优化,非常需要领域专家的指导和支持。希望文字识别和检测的工具也能为大家提供帮助。已经替换了相关缀合。
第三则:合集27773+合集28549=北图12828+北图12932,实物校验,缀合正确。
第四则:合集27754+合集28903=北图12368+北图25359,实物校验,缀合正确。
第五则:合集27083+合补5651=北图6282+北图22288,实物校验,缀合正确。
第十四则:合集7449+合集7106=北图2455+北图10065,实物校验,接口完全不能吻合,缀合有误。
非常感谢胡辉平老师协助验证缀合,这是对我们工作极大的鼓励。第十四则缀合以合集14470+合集11797进行替换(图文另稿再附)。
合集5121+合集10083=北图2184+北图2560,缀合确实有误。合10083上方有横划及左斜划,但不是合5121「往」字的末筆,对接不上。实物校验两版接口不能吻合,且背面的钻凿也不符合。
第十八則存在和第十五則相同的問題。
张老师,我个人认为误缀也是有价值的,应予以保留。新缀可另发一稿,备注上替换原第几则即可。
感谢老师指教。今后我们注意这方面的方法要求。我们的目标还是早日完善缀多多,给大家提供一个通用的缀合平台。欢迎专家们多多指导,让缀多多更完善。
贊同!