所屬欄目:核心期刊 更新日期:2025-06-16 04:06:22
中文信息學報最新期刊目錄
文本風格遷移綜述————作者:劉浦勝;吳連偉;饒元;高超;王震;
摘要:近年來,人工智能技術的不斷突破極大地推動了可控文本生成領域的發展,其中文本風格遷移研究作為核心技術的代表,受到學術界和工業界的廣泛關注。該文梳理了近年來文本風格遷移領域的發展脈絡,首先給出了文本風格遷移的定義及其面臨的挑戰,從應用場景、目的需求兩個視角詳細闡述了該領域四大類型任務,并從數據來源、標簽及數據規模三方面介紹了該領域常用平行數據集及非平行數據集。此外,該文從數據增強、詞匯約束解碼、解糾纏...
基于混合檢索重排序策略的大模型增強方法————作者:張健;唐晉韜;王挺;李莎莎;
摘要:檢索增強生成技術通過提供外部知識幫助大語言模型更準確地回答問題,現有研究表明大語言模型對輸入中知識的位置敏感,這為研究輸入窗口變長后重排序策略對大語言模型性能的潛在影響提供了動機。該文通過構建檢索增強生成系統進行實驗驗證,以段落形式而不是固定長度切分存儲知識更能提高大語言模型的準確率;同時發現在輸入中將檢索知識前置于問題時,逆序重排序更能提高大語言模型的準確率,且隨著檢索知識的數量增加效果會更明顯...
基于注意力機制的多視圖圖神經網絡社區問答專家推薦模型————作者:吳麗萍;熊瑋楠;蘇磊;王瑞;
摘要:社區問答專家推薦模型包括目標問題信息提取和專家信息提取兩個子任務,現有研究通過計算目標問題與專家信息之間的相關性得分來為目標問題推薦合適的專家回答者。然而,現有研究通常在單一的問題標題視圖上展開,往往忽略了問題標簽、正文視圖所蘊含的互補信息,并且沒有從專家信息中學習出對應于目標問題的知識能力。為了充分計算目標問題與專家信息之間的相關性,該文提出了一種基于注意力機制的多視圖圖神經網絡社區問答專家推薦...
融合句法結構和語義信息增強的方面提取方法————作者:付朝燕;黃賢英;鄒世豪;
摘要:針對方面提取(Aspect Extraction, AE)研究中存在的評論文本句法結構不完整、方面詞呈現長尾分布等問題,提出了句法結構和語義信息雙通道增強的方面提取方法(Syntactic and Semantic Dual Reinforcement, SSDR)。首先利用語言模型建立輔助句子并結合領域詞典嵌入進行語義增強;然后基于句法依存樹信息、多頭注意力機制和詞間相對位置信息來增強圖卷積神經...
WTSTC:基于廣域時頻采樣和時序感知卷積的語音識別模型————作者:劉立波;王詠森;劉倩;鄧箴;
摘要:針對現有語音識別模型存在的時頻特征感受野不足、時序特征損失及模型結構擴展性較差等方面的問題,該文提出基于廣域時頻采樣和時序感知卷積的語音識別模型WTSTC,在保證模型輕量化的同時提升識別精度。首先,通過結合RepLKNet模塊和傳統卷積下采樣模塊,構建了一種新型的廣域時頻采樣模塊,增大感受野的同時更加關注輸入音頻序列的時頻特征;其次,設計了時序感知卷積模塊,通過實現應用于時序特征的一維全局響應歸一...
基于用戶立場信息和數據增強的謠言檢測————作者:謝冬冬;李霏;姬東鴻;滕沖;
摘要:社交網絡中的謠言會給社會帶來各種不良影響,通過技術手段進行謠言檢測具有重要的研究意義和現實作用。謠言傳播時,社交網絡用戶會通過回復表達自己對相關謠言的立場,這些回復可以為謠言檢測提供重要的輔助信息,因此可以通過立場和謠言聯合檢測的建模方法來增強謠言檢測的效果。另外,通過對謠言檢測相關工作的梳理,我們發現當前研究對謠言檢測數據集的對話結構利用還不夠充分,包含立場標注的數據集規模也較小。因此,該文通過...
第二十四屆中國計算語言學大會(CCL 2025)征稿啟事
摘要:<正>“第二十四屆中國計算語言學大會”(TheTwenty-fourth China National Conference on Computational Linguistics,CCL2025)將于2025年8月11—14日在山東濟南舉行,會議由中國中文信息學會主辦,齊魯工業大學(山東省科學院)承辦。中國計算語言學大會創辦于1991年,由中國中文信息學會計算語言學專業委員會負責組...
第五屆中國情感計算大會(CCAC 2025)技術評測任務發布
摘要:<正>第五屆中國情感計算大會(Chinese Conferenceon AffectC omputing,CCAC2025)由中國中文信息學會情感計算專委會主辦,西華大學承辦,將于2025年7月18日-20日在四川成都召開。中國情感計算大會每年舉辦一次,旨在聚焦情感計算領域的最新研究和技術成果,現已成為自然語言處理、社會計算領域的重要學術活動,聚集了情感計算的前沿研究,為促進學術界和產...
基于領域信息分解式學習的大語言模型修辭認知增強方法————作者:王雯;于東;劉鵬遠;
摘要:中文修辭手法多樣且概念差異性大,大語言模型對部分修辭手法的認知存在缺陷。針對該問題,該文提出了QAKAG框架,此框架首先引入信息分解式學習思想,通過問答形式檢測大語言模型的修辭認知缺陷,然后以四種不同的知識組合方式探究最優信息補充機制,實現了大語言模型修辭認知能力的增強。該文構建了多類別中文修辭句數據集MCRSD和修辭知識庫MCRKB,并在ChatGPT4等六個大語言模型上開展實驗研究,驗證了QA...
Self-Guide:一種基于自我規劃的大語言模型推理增強方法————作者:劉藝彬;劉正皓;閆宇坤;于是;王碩;楊麟兒;陳慧敏;谷峪;于戈;
摘要:盡管大語言模型在自然語言處理任務中取得顯著進展,但其在復雜問題推理等領域還面臨著認知負荷問題,即大語言模型在推理過程中需要記憶并處理大量信息。因此,如何有效地減少大語言模型推理過程中的認知負荷,緩解推理過程中可能出現的認知過載,是一個亟待解決的問題。對此該文提出了Self-Guide方法,用于增強語言模型的推理能力。該方法通過指引大語言模型生成常識知識和推理指導,讓大語言模型基于自我規劃來增強其推...
對話狀態追蹤模型的數據增強方法研究————作者:劉舒曼;馮洋;
摘要:對話狀態追蹤模型能夠支持任務型對話系統識別任務相關的槽位值。然而,由于標注難度大、領域多樣化,對話狀態追蹤模型常面臨訓練語料稀少和類別難度不均衡等問題。為了解決這些問題,該文提出了使用數據增強的方法。針對類別難度不均衡問題,該文使用局部噪聲強化槽位值的多樣性,加強模型學習槽位無關對話結構的能力;針對訓練語料稀少問題,該文根據語料中由槽位結構構成的任務邏輯序列,通過采樣生成邏輯合法的槽位值序列,增強...
基于數據增強與主題知識共享的低資源情感分類————作者:蔣卓林;王寶樂;艾孜爾古麗·玉素甫;韋金礦;王鵬飛;
摘要:針對低資源語言社交媒體文本的情感分類是低資源語言輿情分析的基礎。低資源語言數據集資源不足,標注困難。數據集的大小以及標簽的不平衡會影響情感分類模型的性能。針對上述問題,該文提出了一種適用于低資源語言情感分析的數據增強方法,該方法改進了傳統的數據增強方法,提高了數據增強樣本生成的質量,用于緩解低資源和標簽不平衡情況下的過擬合問題。同時,除了提取文本本身的情感特征,還通過引入主題特征,與語義信息進行融...
基于多視角特征融合的多模態虛假新聞檢測————作者:肖聰;劉璟;王明文;王菲菲;邵佳興;黃琪;羅文兵;
摘要:隨著社交網絡的廣泛使用,信息分享變得非常便捷,但這同時也加劇了虛假新聞的傳播。現有多模態虛假新聞檢測方法在融合文本與圖像等多種信息源時,未能充分挖掘和利用新聞內容中不同形式的信息,導致語義信息使用不充分;此外,在融合不同層次結構的語義信息時未能充分考慮不同視角和層次間語義信息的關聯性,影響了對新聞內容的深入理解。為此,該文提出了一種多視角特征融合的多模態虛假新聞檢測方法,該方法從單模態語義、情感信...
基于字節對編碼的端到端藏語語音識別研究————作者:蔡郁青;仁增多杰;尼瑪扎西;王超;朱宇雷;張瑾;
摘要:針對藏語端到端語音識別研究中存在的建模單元不統一和識別效果不理想的問題,該文提出了一種BPE-Conformer-CTC/Attention端到端藏語語音識別方法。首先,該方法采用了字節對編碼算法進行語音建模,通過反復合并出現頻率最高的字符對,將文本分割成易于管理、有意義的單元,平衡建模單元的粒度,從而解決藏語語音識別中建模單元不統一的問題。其次,使用了Conformer編碼器,有效地融合了音頻序...
全國知識圖譜與語義計算大會(CCKS2025)
摘要:<正>2025年9月19日—21日全國知識圖譜與語義計算大會(China Conference on Knowledge Graph and Semantic Computing,CCKS)由中國中文信息學會語言與知識計算專業委員會主辦,大會源自中文知識圖譜研討會(Chinese Knowledge Graph Symposium,CKGS)和中國語義網與萬維網科學大會(Chinese...
基于對比學習的轉錄文本翻譯方法研究————作者:王世寧;劉宇宸;宗成慶;
摘要:神經機器翻譯系統極易受到輸入噪聲的干擾,特別是在口語翻譯場景中,翻譯系統的輸入來自語音識別模塊的輸出,而后者不可避免地存在著識別錯誤,最終影響翻譯性能。現有方法多采用錯誤修正和翻譯的級聯式策略以減少識別錯誤造成的影響,但易導致系統時延增長,且可能引入額外的噪聲。該文提出了一種基于對比學習的魯棒神經機器翻譯方法,將包含識別錯誤的樣本作為正例,通過句子級別或詞級別的對比損失,分別從整體和局部兩種不同角...
詞典釋義增強的古文機器翻譯————作者:李家歡;吳若純;黃書劍;胡文菁;陳冀軒;徐維潞;陳家駿;
摘要:古文自動翻譯技術可有效促進古籍的傳承和發展,弘揚中華傳統文化。然而,現有古籍翻譯語料規模較小,知識缺乏,導致古文翻譯系統性能不佳。該文提出使用詞典注釋資源增強古文翻譯系統。作者收集古漢語常見漢字的釋義,并設計了一個詞典釋義選擇-融合的二階段機器翻譯框架,以從詞典釋義中獲取有效信息,去除無效信息。在一個中等規模的古文翻譯數據集上的實驗表明,該文的方法相比于基線模型和前人的釋義融合方法,顯著提升了翻譯...
基于參數分配的多語言神經機器翻譯連續學習研究————作者:谷舒豪;馮洋;
摘要:多語言神經機器翻譯的連續學習旨在讓模型能夠不斷支持新的翻譯方向,且保證原有翻譯方向的性能不發生大幅下降。然而,現有的連續學習方法往往對新支持的翻譯方向存在著若干限制或者模型參數爆炸等問題。為了解決這些問題,該文提出了一種基于參數對翻譯模型重要性的“分而治之”方法。該文提出的方法首先對預訓練翻譯模型的不同參數關于當前翻譯性能的重要性進行評估,然后將對當前翻譯性能影響大的參數在原有翻譯方向和新的翻譯方...
期貨領域知識圖譜構建————作者:李雯昕;昝紅英;關同峰;韓英杰;
摘要:期貨領域是數據最豐富的領域之一,該文以商品期貨的研究報告為數據來源構建了期貨領域知識圖譜(Commodity Futures Knowledge Graph, CFKG)。以期貨產品為核心,確立了概念分類體系及關系描述體系,形成圖譜的概念層;在MHS-BIA與GPN模型的基礎上,通過領域專家指導對242萬字的研報文本進行標注與校對,形成了CFKG數據層,并設計了可視化查詢系統。該文所構建的CFKG...
面向房地產拍賣公告的長文本實體關系抽取方法————作者:韓郁;殷永峰;宋友;仵偉強;王寶會;
摘要:大多數實體關系聯合抽取方法關注實體對在句子內反映的關系,忽略了長文本情景下存在的關系類型分布不均衡等問題。該文面向房地產拍賣公告,基于實體關系抽取思想,針對房地產拍賣公告實體長度較長、關系復雜的情況,設計了一種關系補充抽取機制,并結合全局指針網絡和二部圖匹配算法,最終形成了一個新的關系抽取模型LRCM,增強了模型對長實體和關系重疊三元組的抽取能力,減小了關系類型分布不均衡對關系抽取性能的影響。實驗...
中文信息學報來自網友的投稿評論:
計算機中文T1級期刊,中科院軟件研究所主辦。稿件一大部分都是會議過來的,期刊對文章質量要求特別高,實驗要充足。最重要的,感覺需要較為新穎的創新點,模型拼接的大概率不好使。專家評審很有針對性,編輯服務態度也都很好,中文NLP領域良心期刊。
2023-11-23 15:37主要接受自然語言處理方向的中文期刊,文章質量在中文期刊中中上等。22年11月11日投稿,23年2月13日發錄用通知。總耗時3個月左右,兩個評審的意見都很有道理,對期刊修改有不少幫助。編輯部的速度非常快,基本當天投稿次日就能推進流程。版面費3600。整體的投稿流程和感受都很不錯。
2023-02-15 19:17投稿了一些 但是更多的是通過會議推薦過去的,發表速度比較慢
2022-05-10 18:13常見問題及解答
第七編 工業技術核心期刊推薦
copyright © www.56st48f.cn, All Rights Reserved
搜論文知識網 冀ICP備15021333號-3