人民網
人民網>>河南頻道

寫意中國·說文解“字”丨用大數據破譯漢字密碼 讓“冷門絕學”熱起來

2023年02月18日19:21 | 來源:光明網
小字號

  寫在前面:走進中華文明源頭,感受華夏文字魅力!一橫一豎皆智慧,一撇一捺寫傳奇!河南,是甲骨文的發源地,是《說文解字》的故鄉。3000多年的漢字文化史,可以說就是一部中原漢字史。2月17日,由中央網信辦網絡傳播局指導,河南省委宣傳部、河南省委網信辦、河南省文化和旅游廳、河南日報社、光明網、安陽市委、安陽市人民政府聯合主辦的“寫意中國——探尋漢字起源”網上主題宣傳活動在河南安陽啟動,為了探尋文字的起源,大河網特邀請專家學者“說文解字”,共話文明。

  大家都聽說過甲骨文,但認識甲骨文嗎?甲骨文有多少個?都長什麼樣子?甲骨文作為古文字,離普通大眾距離較遠,對甲骨文的活化利用是我們當前需要研究解決的一個大課題。

  2019年,安陽師范學院計算機與信息工程學院教師劉永革帶領團隊研發的世界第一款免費甲骨文大數據平台“殷契文淵”驚艷亮相,一下拉近了甲骨文與普通大眾的距離。

  3000年前的文字,計算機將如何讀懂?甲骨文“撞上”現代科技,如何讓“冷門”不冷?如何以大眾喜聞樂見的形式展示甲骨文的魅力?

寫意中國·說文解“字”丨用大數據破譯漢字密碼 讓“冷門絕學”熱起來

  深入考古現場,掌握第一手資料

  沉睡3000年的甲骨文急需“喚醒”

  “2000年,當時回到學校,兩位研究甲骨文的老師力主我開展甲骨文信息化研究,而我對甲骨文的認識等同於空白。”作為出身數學專業的本科生和計算機軟件碩士剛畢業的劉永革,自那一刻起,篤定了將甲骨文信息化研究作為一生奮斗的事業。

  談起自己的研究工作,劉永革開玩笑用“兩頭堵”來形容,他說:“一頭是中國最古老的文明甲骨文,另外一頭是先進的計算機技術、人工智能。”

  甲骨文發現於今安陽市西北五裡小屯村北面,距今3000多年,這種遠古文字,也因年代久遠而充滿神秘和未知,破解甲骨文成了世界難題,而要破解還有一個難題擺在面前——我們沒有辦法把甲骨文輸入到電腦。

  “因為甲骨文和漢字不一樣,它好多字我們不認識,所以說你用拼音輸入法不行,還有一些字像一幅畫一樣,那麼也不能用部首,也不能拆分,此前甲骨文輸入法採用編碼輸入,記憶負擔和學習成本較大。”劉永革說。

  劉永革稱,之前不管是寫論文、講課,還是做研究等,所有場合使用都需要用圖片粘貼,研制甲骨文輸入法,建立字庫,讓任何人使用都可以輕鬆輸入至關重要。

  “用計算機技術研究甲骨文的編碼、字庫、輸入法、數據庫建設,為甲骨文專家提供一些工具,輔助甲骨文研究,是我和團隊的主要任務。”

寫意中國·說文解“字”丨用大數據破譯漢字密碼 讓“冷門絕學”熱起來

  劉永革與業界專家學者進行學術交流

  殷契文淵”讓甲骨文瞬間“活起來”

  為了學習最新的研究成果,讓思想不落伍,每當有甲骨文研究專家到安陽,劉永革和團隊成員一定積極請教﹔甲骨文學術研究會議,時間再緊也要參加……

  隨著了解得越來越深入,劉永革發現,我們民族最古老的文字,因為晦澀難懂和研究資料較少,與現實技術不兼容,導致研究效率低下。

  如何讓甲骨文的研究信息共享,讓全人類資源互通,群力群策一起研究呢?劉永革決定利用自己的專業,為甲骨文的發展繪制藍圖。

  於是一個匯集甲骨文信息的“殷契文淵”項目悄然啟動,這個項目就是在互聯網上為世界提供甲骨文的全部信息,讓全世界人民了解甲骨文、認識甲骨文、研究甲骨文。2019年,由劉永革團隊用8年時間精心打造的世界第一款免費甲骨文數據庫 “殷契文淵”驚艷亮相。

  “比如說,某個字不認識,就可以登錄我們的殷契文淵,通過點擊部首,與這個字相關的信息都可以查到,可以把這個字輸入到文檔裡。”劉永革舉例說。

  從“殷契文淵”開放的第一天起,平台就對全世界用戶提供免費服務,它裡面現有152種著錄,是目前最大的甲骨文數據庫。“它不僅服務全球的甲骨文、考古、歷史、文字方面的研究專家,還吸引了古文字愛好者、中小學語文教師、書法愛好者等使用。”

  此前甲骨文資料很難查到,即使甲骨文專家也不可能擁有全部資料,“殷契文淵”項目建成后解決了這個問題。

寫意中國·說文解“字”丨用大數據破譯漢字密碼 讓“冷門絕學”熱起來

  “以老帶新”做好甲骨文信息化研究接續傳承

  科技創新賦能破譯甲骨“文明密碼”

  就在前一陣子,劉永革所在實驗室和騰訊合作,共同開展人機協同助力甲骨文釋讀研究和傳承活化,這個項目主要進行兩方面工作。

  “一方面是利用人工智能技術為釋讀甲骨文提供智能化工具,比如古文字圖形檢索工具。這些工具將設置在‘殷契文淵’﹔另一方面,利用騰訊的傳播平台優勢進行甲骨文的傳播,比如我們正在做的微信小程序‘了不起的甲骨文’,在公眾特別是中小學中傳播甲骨文文化,做好研學活動,由本省發展到全國,該小程序三月底將進行內部測試。”劉永革介紹說。

  為完成甲骨文大數據平台信息採集和錄入工作,每年都有學生從大一開始參與甲骨文信息化課題研究。在劉永革的支持下,學院還開設了《甲骨文信息處理》特色課程。

  “甲骨文研究專家、書法專家、信息技術專家……目前,我們已經組建了一支跨專業、多學科的甲骨文信息化處理團隊,甲骨文信息化教學和科研都位於全國前列。”劉永革驕傲地說。

  “眼下,我們和騰訊合作已經取得了三項技術突破,一是提出了一個甲骨文全信息數字模型,二是研制了光照變換矩陣的甲骨文高清拍攝技術,三是確立了甲骨三維建模的技術和設備,馬上進行第一批甲骨文三維建模實驗。”

  “做好傳承,把‘殷契文淵’建設好,使安陽真正成為世界甲骨文數據中心﹔大膽創新,利用人工智能技術破譯甲骨文,讓科技賦能研究,用計算機破解甲骨文,揭開甲骨背后‘文明密碼’,講好甲骨文的故事。”劉永革說,他要將甲骨學研究帶入新的智能化時代。(臧小景)

(責編:辛靜、楊曉娜)

分享讓更多人看到

推薦視頻
  • 盧旺達留學生愛吃中國媽媽包的餃子
  • 驚艷!用中國傳統色打開錦繡山河
  • 新年迎好運!"七彩祥雲"現雲南大理
返回頂部