世俱杯规则-虎牙直播-比利亚vs西班牙人-德国杯|www.cnyhmy.com

大語(yǔ)言模型賦能圖書館服務(wù)的測(cè)評(píng)及其應(yīng)對(duì)策略

時(shí)間:2024-10-23 10:45:03 來源:網(wǎng)友投稿

摘要:大語(yǔ)言模型為圖書館智慧服務(wù)、精準(zhǔn)服務(wù)的進(jìn)步提供了巨大可能。文章通過測(cè)試國(guó)內(nèi)外多個(gè)大語(yǔ)言模型在執(zhí)行圖書館信息咨詢服務(wù)時(shí)的全面性和準(zhǔn)確性,為大語(yǔ)言模型賦能圖書館精準(zhǔn)化智慧服務(wù)提供參考。以圖書館信息服務(wù)中的問題提示語(yǔ)為例,運(yùn)用語(yǔ)言學(xué)方法,在詞匯、句子及其關(guān)系的層次上分析、比較、統(tǒng)計(jì)這些輸出結(jié)果的全面性和準(zhǔn)確性及其原因。從詞匯、句子及其關(guān)系的角度來看,大語(yǔ)言模型在圖書館精準(zhǔn)服務(wù)方面的全面性和準(zhǔn)確性程度來源于對(duì)其詞匯、短語(yǔ)、句子、段落等實(shí)體及其關(guān)系標(biāo)注的完善性以及算法的先進(jìn)性與否。圖書館運(yùn)用大語(yǔ)言模型賦能精準(zhǔn)化、智慧化信息服務(wù),建議參照多個(gè)大模型的輸出結(jié)果以互補(bǔ),再進(jìn)一步配合相關(guān)文獻(xiàn)資料予以分析、佐證,以力求所獲知識(shí)的準(zhǔn)確性和全面性,同時(shí)還應(yīng)注重提示語(yǔ)的使用技巧。

關(guān)鍵詞:大語(yǔ)言模型;
ChatGPT;
圖書館賦能;
信息服務(wù);
精準(zhǔn)化服務(wù)

中圖分類號(hào):G252文獻(xiàn)標(biāo)志碼:A

0 引言

2022年11月,Open AI公司推出了里程碑式的大語(yǔ)音模型——ChatGPT-3,5天獲得100萬用戶[1],2023年4月Chat GPT-4發(fā)布,周活躍用戶超1億。國(guó)內(nèi)的互聯(lián)網(wǎng)巨頭、人工智能企業(yè)也紛紛推出各自的大語(yǔ)言模型,比如百度的文心一言、阿里的通義千問、科大訊飛的星火、字節(jié)的豆包等[2-3]。大語(yǔ)言模型(Large Language Model)通過對(duì)海量文本數(shù)據(jù)進(jìn)行多層深度網(wǎng)絡(luò)的訓(xùn)練,利用創(chuàng)新的Transformer算法學(xué)習(xí)語(yǔ)言的結(jié)構(gòu)、規(guī)則和語(yǔ)義,從而可以生成具有自然語(yǔ)言風(fēng)格的文本或回答自然語(yǔ)言的問題。人工智能生成內(nèi)容(Artificial Intelligence Generated Content,AIGC)作為大語(yǔ)言模型的應(yīng)用,為智能問答系統(tǒng)帶來了顛覆性變革,使其可以高度智能化地理解人類語(yǔ)言,并生成連貫、自然的對(duì)話內(nèi)容[4]。

圖書館正處于由傳統(tǒng)服務(wù)向智慧化服務(wù)轉(zhuǎn)型升級(jí)的階段,尤其是各高校圖書館正著力提升圖書館服務(wù)的智慧化、精準(zhǔn)化,以期為教學(xué)和科研提供更及時(shí)可靠的信息支撐。無論是為讀者改善閱讀體驗(yàn)、提供個(gè)性化服務(wù)、智能問答和輔導(dǎo)、提高檢索效率和準(zhǔn)確性,還是為圖書館員提供學(xué)習(xí)培訓(xùn)支持、數(shù)據(jù)分析與決策支持[5],大語(yǔ)言模型都將發(fā)揮積極作用。對(duì)大語(yǔ)言模型賦能圖書館服務(wù)中的全面性和準(zhǔn)確性進(jìn)行研究,將有助于這一智能技術(shù)在未來的圖書館精準(zhǔn)化、智慧化服務(wù)中發(fā)揮更有力的作用。

1 大語(yǔ)言模型賦能圖書館服務(wù)研究現(xiàn)狀

目前,大語(yǔ)言模型與圖書館服務(wù)相關(guān)的研究大多集中在歸納總結(jié)大語(yǔ)言模型在圖書館中適用的不同應(yīng)用場(chǎng)景[6-9]和大語(yǔ)言模型為圖書館行業(yè)帶來的機(jī)遇與挑戰(zhàn)[10-12]等方面。在大語(yǔ)言模型與圖書館服務(wù)中應(yīng)用的研究方面,符榮鑫等[6]從理論著手,應(yīng)用概念的分析、比較、綜合、抽象的方法,歸納總結(jié)出AIGC的6個(gè)共同特征和9個(gè)差異特征。王翼虎等[4]通過大語(yǔ)言模型微調(diào)+langchain本地知識(shí)庫(kù)的聯(lián)合應(yīng)用方案,驗(yàn)證了其在圖書館參考咨詢服務(wù)中的可行性。趙浜等[13]應(yīng)用實(shí)證的方法,在兩個(gè)大語(yǔ)言模型GPT-3.5-Turbo和ChatGLM-6B上進(jìn)行測(cè)試,從宏觀角度出發(fā)對(duì)其總結(jié)、拓展、分類、對(duì)比、推理、計(jì)算、檢索、轉(zhuǎn)換、編程等能力水平進(jìn)行分析評(píng)價(jià),得出大語(yǔ)言模型在執(zhí)行多數(shù)典型情報(bào)任務(wù)上都展現(xiàn)出了較強(qiáng)能力的結(jié)論。雖然已有文獻(xiàn)對(duì)大語(yǔ)言模型在賦能圖書館各項(xiàng)任務(wù)以及從思維方法兩個(gè)角度對(duì)大語(yǔ)言模型的表現(xiàn)進(jìn)行了測(cè)試,但從圖書館某項(xiàng)任務(wù)的完成度,并不能解釋大語(yǔ)言模型生成內(nèi)容全面性和準(zhǔn)確性與否的原因,從思維(分析、概括等)的角度也無法理解其處于目前水平的根本原因。因此,大語(yǔ)言模型能否為圖書館很好地賦能,應(yīng)先對(duì)其進(jìn)行較為客觀的、全面的了解,而不能滿足于根據(jù)大模型目前顯現(xiàn)的能力而進(jìn)行簡(jiǎn)單地“暢想”[14]。實(shí)際上,大語(yǔ)言模型性能高低的原因主要取決于兩個(gè)方面:一是知識(shí)圖譜的完整性,二是算法的有效性。知識(shí)圖譜的完整性決定大語(yǔ)言模型提供答案的全面性、準(zhǔn)確性。算法的有效性決定知識(shí)(詞、句等)之間關(guān)系識(shí)別的正確性。圖書館各項(xiàng)任務(wù)賦能的水平歸根結(jié)底是模型理解語(yǔ)言底層邏輯的水平。目前還沒有文獻(xiàn)從語(yǔ)言學(xué)中詞、句及其關(guān)系的角度來總結(jié)大語(yǔ)言模型的性能現(xiàn)狀及其原因。本文從語(yǔ)言學(xué)角度,以圖書館信息服務(wù)中的問題提示語(yǔ)為例,對(duì)10多個(gè)大語(yǔ)言模型的輸出結(jié)果進(jìn)行統(tǒng)計(jì)分析,歸納出大語(yǔ)言模型當(dāng)前性能現(xiàn)狀及其原因,并提出相應(yīng)的應(yīng)對(duì)策略。

2 研究設(shè)計(jì)

目前,具有代表性的AIGC包括文心一言、通義千問、訊飛星火、豆包、百川大模型、天工AI、面壁露卡、智譜清言[15]、ChatGPT等。而圖書館作為知識(shí)寶庫(kù)和信息中心、學(xué)習(xí)中心,需要被賦能的工作往往要求知識(shí)的全面性、準(zhǔn)確性,因此,主要通過測(cè)試這些大模型在信息服務(wù)場(chǎng)景中輸出結(jié)果的全面性和準(zhǔn)確性來驗(yàn)證這一指標(biāo)是否達(dá)到。圖書館服務(wù)包括讀者服務(wù)、信息檢索、參考咨詢、智能推介、科技情報(bào)分析、學(xué)科服務(wù)、培訓(xùn)教育等多個(gè)應(yīng)用場(chǎng)景,無論是將大語(yǔ)言模型嵌入哪種服務(wù)場(chǎng)景,都離不開用戶與大語(yǔ)言模型之間進(jìn)行文本交互,以文字(或?qū)⒄Z(yǔ)音識(shí)別為文字)的形式提出需求其輸出結(jié)果的必要環(huán)節(jié)。探究大語(yǔ)言模型賦能圖書館精準(zhǔn)化信息服務(wù)的準(zhǔn)確性、全面性問題,歸根到底仍要從語(yǔ)言學(xué)底層本質(zhì)邏輯上進(jìn)行分析。本文模擬不同信息服務(wù)場(chǎng)景中用戶與大模型之間的問答環(huán)節(jié),從幾個(gè)問題提示語(yǔ)的輸出結(jié)果中發(fā)現(xiàn)問題并分析原因。

3 研究方法/過程

包括ChatGPT在內(nèi)的11個(gè)模型參與測(cè)試,對(duì)模型回答出現(xiàn)的問題進(jìn)行提煉并分析原因。

實(shí)例1:(提示語(yǔ))游泳誘發(fā)的心臟病有哪幾種?

問題1:回答的全面性不足。各種模型分別給出了游泳可能誘發(fā)的心臟病類型中的某幾個(gè)種類,而通過人工檢索文獻(xiàn)數(shù)據(jù)庫(kù)和開放的搜索引擎,歸納總結(jié),可得出冠心病、心肌缺血、心律失常、心律不齊、心力衰竭、心肌炎、冠狀動(dòng)脈性心臟病等患者都有被游泳誘發(fā)心臟病的潛在危險(xiǎn)[16-17],任何患有或有心臟病風(fēng)險(xiǎn)的人在潛水前一定要咨詢醫(yī)生[18]。這個(gè)結(jié)論,說明各模型給出的答案全面性方面都存在不足。

問題2:回答的準(zhǔn)確性不足。表現(xiàn)在以下兩個(gè)方面:(1)錯(cuò)誤的上下位關(guān)系。比如面壁露卡給出的答案中包括“高血壓”,智譜清言的答案中包括“腦供血不足”。“高血壓”“腦供血不足”均屬于心腦血管疾病,但不屬于心臟病,可見面壁露卡將“心血管疾病”與“心臟病”概念混淆,智譜清言將“腦血管疾病”與“心臟病”混淆。(2)錯(cuò)誤的對(duì)應(yīng)關(guān)系。百川大模型給出的答案中第4條將“靜止?fàn)顟B(tài)”與“游泳”形成錯(cuò)誤的對(duì)應(yīng)關(guān)系(見圖1)。

原因分析:

首先,參與測(cè)試的大語(yǔ)言模型中沒有建立字、詞等細(xì)顆粒度概念的正確上下位關(guān)系。在大語(yǔ)言模型的前期標(biāo)注中,沒有將作為上位概念的“心臟病”與其所有下位概念建立準(zhǔn)確、完整的關(guān)系,或在模型的知識(shí)圖譜中缺少“心臟病”患者和參與某些運(yùn)動(dòng)項(xiàng)目時(shí)存在禁忌事項(xiàng)的關(guān)系。

其次,參與測(cè)試的大語(yǔ)言模型的算法出現(xiàn)問題。大語(yǔ)言模型在回答問題的同時(shí),時(shí)間上不允許識(shí)別已有訓(xùn)練數(shù)據(jù)或歷史文獻(xiàn)中“心臟病”與其下位疾病之間關(guān)系這一過程。或者正是由于有天文級(jí)的訓(xùn)練文本量來作“訓(xùn)練數(shù)據(jù)庫(kù)”,而其算力不足,根本無法支持這種即時(shí)搜索和識(shí)別功能的準(zhǔn)確性和全面性。

最后,參與測(cè)試的大語(yǔ)言模型只對(duì)其“訓(xùn)練數(shù)據(jù)庫(kù)”中某些文獻(xiàn)或某篇文章進(jìn)行知識(shí)抽取,而該篇文章中涉及“心臟病”的下位概念不全。從輸出結(jié)果看,每個(gè)大模型給出心臟病的下位概念都不同。甚至針對(duì)同一問題,同一個(gè)模型多次給出的下位概念也會(huì)存在差異。因此,該推測(cè)具有一定合理性。

實(shí)例2(提示語(yǔ)):如何智能地識(shí)別句子之間的各種關(guān)系?

通義千問給出的答案如圖2所示。

問題及原因分析:

首先,提示語(yǔ)中句子的省略部分識(shí)別錯(cuò)誤。在上例提示語(yǔ)中,“智能”這一關(guān)鍵詞具有潛在含義,表示被省略的主語(yǔ)是“機(jī)器”或“計(jì)算機(jī)”,而通義千問給出的答案對(duì)應(yīng)的主語(yǔ)是“人”。究其原因,除了以大語(yǔ)言模型現(xiàn)階段的能力還無法達(dá)到與人類的思維能力高度一致,提示語(yǔ)表述不夠清晰明了也是出現(xiàn)錯(cuò)誤的重要因素。

其次,大模型答案全面性不足。除通義千問外的其他9個(gè)模型,雖然正確識(shí)別出該提示語(yǔ)的主語(yǔ)是“機(jī)器”,但從每個(gè)模型給出的識(shí)別方法來看,有重復(fù)、有不同,卻都不夠完整。例如,文心一言給出的方法是依存句法分析、語(yǔ)義角色標(biāo)注、關(guān)系抽取;
智普清言給出的方法是句法分析、語(yǔ)義分析、實(shí)體識(shí)別、機(jī)器學(xué)習(xí)。其中,ChatGPT給出的方法是較為全面的,包括詞向量和嵌入表示、句子向量化、神經(jīng)網(wǎng)絡(luò)、注意力機(jī)制、語(yǔ)義角色標(biāo)注、圖神經(jīng)網(wǎng)絡(luò)、遷移學(xué)習(xí)、知識(shí)圖譜、監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)9種,盡管如此,也沒有形成完整的答案體系。其原因應(yīng)該是這些模型都沒有建立“識(shí)別句子間關(guān)系”與各種技術(shù)(人工智能、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理)之間完整全面的對(duì)應(yīng)關(guān)系。

最后,同位關(guān)系與上下位關(guān)系出現(xiàn)混亂。根據(jù)提示語(yǔ)的提問,各模型列出的多種方法之間應(yīng)該是并列的同位關(guān)系。而在ChatGPT給出的方法中,同時(shí)出現(xiàn)了“監(jiān)督學(xué)習(xí)”和“神經(jīng)網(wǎng)絡(luò)”,而“神經(jīng)網(wǎng)絡(luò)”是有監(jiān)督學(xué)習(xí)的方法之一,二者應(yīng)是上下位關(guān)系,而非同位關(guān)系。從該問題可看出,大語(yǔ)言模型還沒有清晰地建立起詞與詞之間準(zhǔn)確的同位關(guān)系和上下位關(guān)系。

實(shí)例3(提示語(yǔ)):大語(yǔ)言模型輸出的結(jié)果對(duì)應(yīng)與圖書情報(bào)中哪些任務(wù)?

問題及原因分析:由于在提示語(yǔ)中將“于”錯(cuò)寫成了“與”,通義千問模型將“大語(yǔ)言模型輸出的結(jié)果對(duì)應(yīng)了圖書館情報(bào)中哪些任務(wù)”理解為“大語(yǔ)言模型與圖書情報(bào)的關(guān)系”(見圖3)。

將提示語(yǔ)中的“于”字改正過來后,則給出了相對(duì)合理的結(jié)果。可見,提示語(yǔ)的表達(dá)是否準(zhǔn)確、清晰、具體,也會(huì)直接影響大語(yǔ)言模型輸出結(jié)果的準(zhǔn)確性。究其原因,一是該模型缺少容錯(cuò)機(jī)制,二是沒有模糊匹配的算法。

4 結(jié)果/結(jié)論

4.1 大語(yǔ)言模型輸出內(nèi)容的準(zhǔn)確性和全面性不足

主要體現(xiàn)在以下4個(gè)方面。

(1)實(shí)體詞之間的上下位出現(xiàn)錯(cuò)誤,如將“高血壓”“腦供血不足”識(shí)別為“心臟病”的下位概念。

(2)實(shí)體詞之間的對(duì)應(yīng)關(guān)系出現(xiàn)錯(cuò)誤或?qū)?yīng)關(guān)系不全,如將“游泳”與“靜止”狀態(tài)形成錯(cuò)誤的對(duì)應(yīng)關(guān)系。

(3)實(shí)體詞之間的同位關(guān)系不全,如“監(jiān)督學(xué)習(xí)”和“神經(jīng)網(wǎng)絡(luò)”這對(duì)上下位關(guān)系詞被當(dāng)作同位關(guān)系詞使用等。

(4)某些模型沒有容錯(cuò)機(jī)制和模糊匹配算法,如提示語(yǔ)中省略主語(yǔ)便無法正確識(shí)別句子意思;
如提示語(yǔ)中的“對(duì)應(yīng)于”錯(cuò)寫成“對(duì)應(yīng)與”,便無法根據(jù)其他關(guān)鍵詞來識(shí)別信息等。

4.2 大語(yǔ)言模型對(duì)準(zhǔn)確性要求高的學(xué)科領(lǐng)域賦能程度有待提高

從本文實(shí)例1可見,在醫(yī)療信息領(lǐng)域,大語(yǔ)言模型答案的全面性有時(shí)低至1/2或1/3。美國(guó)學(xué)者Nehal等[19]測(cè)試了GPT-4對(duì)皮膚科患者常見問題的回答,該科醫(yī)生認(rèn)為ChatGPT的測(cè)試結(jié)論中存在2/3的不恰當(dāng)回答。其中某些答案不完整,某些存在錯(cuò)誤信息。這一觀點(diǎn)與本文實(shí)例1的數(shù)據(jù)分析結(jié)論不謀而合。而Naoki等[20]對(duì)GPT-4在診斷健康狀況中的準(zhǔn)確性進(jìn)行了評(píng)估,得出GPT-4和醫(yī)生之間診斷準(zhǔn)確性相當(dāng)?shù)慕Y(jié)論,但不可回避的是,醫(yī)生的診斷也存在誤診問題。

另外,基于信息安全性的考慮,大語(yǔ)言模型的信息獲取源只能是存在于開放網(wǎng)絡(luò)上的信息,這些信息可能來自政治組織、非營(yíng)利組織、公司和個(gè)人的文本。而大量有版權(quán)保護(hù)的發(fā)明專利、權(quán)威性文獻(xiàn)和最新的科研成果是它無法輕易獲取的。這也導(dǎo)致了大語(yǔ)言模型輸出的結(jié)果在準(zhǔn)確性和權(quán)威性上大打折扣。

4.3 提示語(yǔ)的表述對(duì)大語(yǔ)言模型輸出結(jié)果的影響

實(shí)例2提示語(yǔ)中主語(yǔ)的省略和實(shí)例3提示語(yǔ)中的錯(cuò)別字,都影響到了大模型輸出結(jié)果的準(zhǔn)確性。除了大語(yǔ)言模型缺乏有效的容錯(cuò)機(jī)制和模糊匹配算法,還涉及提示語(yǔ)工程問題。

5 建議/策略

5.1 大語(yǔ)言模型的開發(fā)者還需完善大語(yǔ)言模型的知識(shí)圖譜,并提高其算法

如果訓(xùn)練樣本之間沒有建立完善的知識(shí)圖譜,在語(yǔ)言底層邏輯混亂的情況下,便無法正確學(xué)習(xí)出諸如上下位關(guān)系和同位關(guān)系、同義關(guān)系和反義關(guān)系等細(xì)顆粒度語(yǔ)義之間的關(guān)系。這些因語(yǔ)法、詞匯、語(yǔ)義和上下文混淆造成的錯(cuò)誤回答,對(duì)有相關(guān)專業(yè)知識(shí)儲(chǔ)備的用戶而言,可利用已有知識(shí)對(duì)其進(jìn)行雜質(zhì)過濾、數(shù)據(jù)清洗的干擾排除,但會(huì)對(duì)大量非專業(yè)的用戶造成極大困擾。因此,訓(xùn)練模型學(xué)習(xí)出各種概念詞匯之間的關(guān)系,建立完整的知識(shí)圖譜仍是解決問題不可缺少的一環(huán)。

大語(yǔ)言模型的開發(fā)者需繼續(xù)完善預(yù)訓(xùn)練數(shù)據(jù)文本的知識(shí)圖譜,并在識(shí)別概念之間關(guān)系的算法上進(jìn)一步提高性能。只有增強(qiáng)其輸出內(nèi)容的全面性和準(zhǔn)確性,才能達(dá)到賦能圖書館精準(zhǔn)化信息服務(wù)的要求。

5.2 大語(yǔ)言模型與現(xiàn)有的信息檢索方式并存,用戶可各采其長(zhǎng),避其不足

圖書館作為信息服務(wù)中心服務(wù)于全學(xué)科領(lǐng)域,其用戶對(duì)信息服務(wù)的要求更突出準(zhǔn)確性和全面性。而大語(yǔ)言模型發(fā)展至目前階段,所提供的信息服務(wù)在此方面仍存在不足。此外,由實(shí)例還可看出,依據(jù)各個(gè)模型預(yù)訓(xùn)練時(shí)所擁有的“訓(xùn)練數(shù)據(jù)庫(kù)”數(shù)據(jù)量及算力的不同,各個(gè)模型之間檢索出的答案也存在較大差異,如單獨(dú)使用,則答案的精準(zhǔn)性得不到保障。

圖書館已有的數(shù)據(jù)庫(kù)文獻(xiàn)檢索功能和現(xiàn)有的開放式搜索引擎恰好可以與大語(yǔ)言模型實(shí)現(xiàn)很好地結(jié)合。用戶可以多管齊下,既要盡可能多個(gè)模型同時(shí)應(yīng)用,又要與搜索引擎、數(shù)據(jù)庫(kù)文獻(xiàn)檢索功能相互配合使用。例如,若想獲得某學(xué)科或某研究方向較全面準(zhǔn)確的知識(shí)點(diǎn)提示,可同時(shí)參照多個(gè)大模型的輸出結(jié)果,或求其并集,或互相驗(yàn)證,在多個(gè)輸出結(jié)果的知識(shí)要點(diǎn)引導(dǎo)下進(jìn)行綜合考量。再進(jìn)一步配合相關(guān)文獻(xiàn)資料予以分析、佐證,以力求所獲知識(shí)的準(zhǔn)確性和全面性。

5.3 注重提示語(yǔ)工程,提高與大語(yǔ)言模型之間交流的有效性

大語(yǔ)言模型任何功能的使用,實(shí)質(zhì)上均可概括為“我問你答”的過程。如何使這種“人”“機(jī)”交互的結(jié)果達(dá)到使用者的預(yù)期,則提示語(yǔ)的使用顯得尤為重要。從本文實(shí)例中可總結(jié)提高提示語(yǔ)有效性的方法,以供參考:其一,語(yǔ)境完整。提示語(yǔ)中盡量不出現(xiàn)錯(cuò)字、不省略句子結(jié)構(gòu),提供盡可能完整的上下文信息。必要時(shí),可采用舉例說明、類比的方式,先“教”再“問”,讓大模型根據(jù)使用者的前情提示來回答。其二,拆分問題,將邏輯復(fù)雜的問題拆分為多個(gè)簡(jiǎn)單的小問題,通過引導(dǎo),由低階到高階逐步解決問題。此外,還可配合使用“還有呢?”“請(qǐng)繼續(xù)!”“可以補(bǔ)充說明嗎?”等引導(dǎo)語(yǔ),促使模型給出更多更全面的答案。

參考文獻(xiàn)

[1]文繼榮.2023年大模型行業(yè)深度研究報(bào)告(系統(tǒng)了解“ChatGPT”)[EB/OL].(2023-10-16)[2023-10-20].https://m.toutiao.com/is/idQyGyf7/.

[2]白首窮經(jīng)之杰.主流AI大模型對(duì)比:ChatGPT、訊飛星火、文心一言和豆包[EB/OL].(2023-09-26)[2023-10-20].https://m.toutiao.com/is/idQD3Ygf/.

[3]劉言飛語(yǔ).字節(jié)的豆包,與文心一言、通義千問、ChatGPT在9個(gè)問題上的對(duì)比[EB/OL].(2023-08-19)[2023-10-20].https://m.toutiao.com/is/idQyESmq/.

[4]王翼虎,白海燕,孟旭陽(yáng).大語(yǔ)言模型在圖書館參考咨詢服務(wù)中的智能化實(shí)踐探索[J].情報(bào)理論與實(shí)踐,2023(8):96-103.

[5]DANIEL G, SOPHIA N, CARINA W, et al. A SWOT (strengths, weaknesses, opportunities, and threats) analysis of ChatGPT in the medical literature:
concise review[J]. Journal of Medical Internet Research,2023(16):
e49368.

[6]符榮鑫,楊小華.AIGC語(yǔ)言模型分析及其高校圖書館應(yīng)用場(chǎng)景研究[J].農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2023(7):27-38.

[7]壽建琪.走向“已知之未知”:GPT大語(yǔ)言模型助力實(shí)現(xiàn)以人為本的信息檢索[J].農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2023(5):16-26.

[8]張慧,佟彤,葉鷹.AI2.0時(shí)代智慧圖書館的GPT技術(shù)驅(qū)動(dòng)創(chuàng)新[J].圖書館雜志,2023(5):4-8.

[9]吳進(jìn),馮劭華,昝棟.ChatGPT與高校圖書館參考咨詢服務(wù)[J].大學(xué)圖書情報(bào)學(xué)刊,2023(5):25-29.

[10]施志唐.ChatGPT對(duì)圖書館的影響與應(yīng)對(duì)措施[J].圖書情報(bào)導(dǎo)刊,2023(4):1-6.

[11]李書寧,劉一鳴.ChatGPT類智能對(duì)話工具興起對(duì)圖書館行業(yè)的機(jī)遇與挑戰(zhàn)[J].圖書館論壇,2023(5):104-110.

[12]張強(qiáng),高穎,趙逸淳,等.ChatGPT在智慧圖書館建設(shè)中的機(jī)遇與挑戰(zhàn)[J].圖書館理論與實(shí)踐,2023(6):116-122.

[13]趙浜,曹樹金.國(guó)內(nèi)外生成式AI大模型執(zhí)行情報(bào)領(lǐng)域典型任務(wù)的測(cè)試分析[J].情報(bào)資料工作,2023(5):6-17.

[14]劉倩倩,劉圣嬰,劉煒.圖書情報(bào)領(lǐng)域大模型的應(yīng)用模式和數(shù)據(jù)治理[J].圖書館雜志,2023(12):22-35.

[15]IT之家.百度字節(jié)等8家公司大模型產(chǎn)品通過生成式人工智能備案,可上線向公眾提供服務(wù)[EB/OL].(2023-08-31)[2023-10-20].https://www.ithome.com/0/715/938.htm.

[16]鄭劍暉.這些人不宜參加游泳[J].游泳,2005(4):18.

[17]唐春生.心臟病患者到底能不能游泳[J].人人健康,2018(17):19.

[18]葉子明.試試水:嘗試水上鍛煉[J].心血管病防治知識(shí)(科普版),2019(4):54-56.

[19]NEHAL L, LEELAKRISHNA C, CHRISTIAN G, et al. Assessing the accuracy and comprehensiveness of ChatGPT in offering clinical guidance for atopic dermatitis and acne vulgaris[J]. JMIR Dermatology, 2023(6):1-4.

[20]NAOKI I, SAKINA K, MINETO F, et al. The accuracy and potential racial and ethnic biases of GPT-4 in the diagnosis and triage of health conditions:
evaluation study[J]. JMIR Medical Education,2023(9):
47532.

(編輯 何 琳編輯)

Evaluation and response strategies of empowering library services with the big language model

CHEN? Yanyan

(Library, Henan University, Kaifeng 475004, China)

Abstract:? The big language model provides great potential for the advancement of intelligent and precise services in libraries. The article tests the comprehensiveness and accuracy of multiple large language models at home and abroad in executing library information consulting services, providing reference for empowering libraries with precise and intelligent services through large language models. Taking the problem prompts in library information services as an example, using linguistic methods, analyze, compare, and statistically analyze the comprehensiveness, accuracy, and reasons of these output results at the level of vocabulary, sentences, and their relationships. From the perspective of vocabulary, sentences and their relationships, the comprehensiveness and accuracy of the big language model in the precise service of the library comes from the perfection of the annotation of its words, phrases, sentences, paragraphs and other entities and their relationships, as well as the progressiveness of the algorithm. The library utilizes a large language model to empower precise and intelligent information services. It is recommended to refer to the output results of multiple large models for complementarity, and further analyze and support them with relevant literature to strive for the accuracy and comprehensiveness of the knowledge obtained. At the same time, attention should also be paid to the use of language prompts.

Key words:
big language model; ChatGPT; library empowerment; information service; precision service

基金項(xiàng)目:河南省圖書情報(bào)研究項(xiàng)目;
項(xiàng)目名稱:智慧服務(wù)情景下文獻(xiàn)資源的精細(xì)化組織與精準(zhǔn)化服務(wù)研究;
項(xiàng)目編號(hào):HNTQL-2023-008。

作者簡(jiǎn)介:陳艷艷(1979— ),女,館員,碩士;
研究方向:圖書館智慧服務(wù)、信息服務(wù)等。

猜你喜歡 信息服務(wù) 微信平臺(tái)在公共圖書館信息服務(wù)中的應(yīng)用博覽群書·教育(2016年9期)2016-12-12智慧社區(qū)信息服務(wù)績(jī)效評(píng)價(jià)研究中小企業(yè)管理與科技·下旬刊(2016年10期)2016-11-18公共圖書館科技創(chuàng)新服務(wù)探析新世紀(jì)圖書館(2016年9期)2016-11-15農(nóng)業(yè)高校圖書館專利信息服務(wù)研究?jī)r(jià)值工程(2016年29期)2016-11-14基于價(jià)值共創(chuàng)共享的信息服務(wù)生態(tài)系統(tǒng)協(xié)同機(jī)制研究科技視界(2016年18期)2016-11-03微信公眾平臺(tái)在高校圖書館信息服務(wù)中的應(yīng)用研究科技視界(2016年21期)2016-10-17

推薦訪問:測(cè)評(píng) 模型 圖書館

最新推薦
猜你喜歡