文本標註
文本註釋是指為文本添加筆記或評註的行為與結果,其中可能包含螢光標示或底線、評論、註腳、標籤與連結。文本註釋可包含讀者為個人目的所寫的筆記,也可用於協作寫作與編輯、評論或社交閱讀與分享等目的之共享註釋。在某些領域,文本註釋可與後設資料相提並論,因為它是在事後添加,提供關於文本的資訊,而不會從根本上改變原始文本。文本註釋有時也被稱為頁邊旁註(marginalia),不過有些人將此術語專門保留給書籍或手稿頁邊的手寫筆記。研究發現註釋很有用,有助於增進英國文學知識。
註釋可以是私人的,也可以是社交共享的,形式包含手寫註釋與基於資訊科技的註釋。註釋與做筆記不同,因為註釋必須實際書寫或添加在原始文本上。這可以是在書頁內書寫、標示螢光線,或者,如果文本是數位的,則是在文件內發表評論或儲存螢光標示或底線。關於網頁內容(包含圖片與其他非文本內容)的註釋資訊,另請參見網頁註釋。
歷史
文本註釋的歷史可能與在媒材上書寫一樣古老,只要能以合理的力氣製作出額外的副本即可。約在西元 1000 年左右,文本註釋在塔木德評註和阿拉伯修辭學論文中成為一項重要活動。在中世紀,抄寫手稿的抄寫員常會做頁邊註釋,這些註釋會隨著手稿流傳,從而與社群共享;有時,當這些手稿後來被重新抄寫時,註釋也會被複製到新版本中。
隨著印刷機的興起,以及個人(而非共享)文本副本的流通與購買變得相對容易,社交共享註釋的普遍性下降,文本註釋變成了一種更為私人的活動,由讀者與文本互動構成。在共享的文本副本(如圖書館書籍)上做的註釋,有時被視為貶低文本價值或是一種污損行為。因此,印刷技術主要支援以正式學術評論或文本註腳、章節附註的形式來流傳註釋,而非私人讀者所做的頁邊手寫評論,儘管手寫評論或註釋在協作寫作或編輯中很常見。
以電腦為基礎的技術為個人和社交共享的文本註釋提供了新的機會,支援多種目的,包括讀者的個人閱讀目標、學習、社交閱讀、寫作與編輯以及其他實踐。資訊科技(IT)系統中的文本註釋引發了存取、連結和儲存等技術問題,這些問題通常與紙本的文本註釋無關,因此這類系統的研究與開發常著重於這些領域。
功能與應用
文本註釋在私人和公共的閱讀與溝通實踐中可以發揮多種功能。學者 Joanna Wolfe 和 Christine Neuwirth 在其文章《從邊緣到中心:註釋的未來》中,指出現代註釋普遍具有四項主要功能,包括:(1)「促進閱讀與後續的寫作任務」,這包含支援個人與專業目的閱讀的註釋;(2)「窺見其他讀者的見解」,這涉及註釋的分享;(3)「向作者提供回饋或促進與協作者的溝通」,這可包含個人、專業及教育相關的回饋;以及(4)「喚起對主題和重要段落的注意」,學術註釋、註腳和特別標示常發揮此功能。關於註釋如何支援個人閱讀任務,Catherine Marshall 指出,讀者註釋文本的方式取決於閱讀的目的、動機和情境。讀者註釋的目的可能是為了幫助詮釋文本、為未來參考或閱讀標示出某個部分、輔助記憶與回憶、幫助自己在閱讀時集中注意力於文本、解決與文本相關的問題,或是創造與文本並無特定關聯的註釋。
教育應用
文本註釋的教育研究探討了私人與共享文本註釋在支持學習目標與溝通方面所能扮演的角色。許多教育研究檢視了學生對文本的私人註釋如何支持理解與記憶;例如,研究指出註釋文本會引發對資訊更深度的處理,從而提升資訊的回憶效果。因為註釋是在手持書寫工具閱讀時進行的,讀者在閱讀時理應更清楚自己的思緒。這意味著讀者在做筆記以幫助記憶或更佳理解內容的同時,也積極地參與活動,因此在註釋文本時,更能接納資訊。
教育研究的其他領域則調查了社交共享文本註釋對協作學習的好處,無論是紙本還是基於資訊科技的註釋共享。例如,Joanna Wolfe 的研究探討了接觸他人註釋對學生讀者與作者的好處。在 2000 年的一項研究中,Wolfe 發現讓學生接觸他人的註釋會影響他們對註釋者的看法,進而塑造他們對材料的回應及其書面作品。在後來的研究中,Wolfe 發現,在紙本上觀看他人的書面評論,特別是那些對文本呈現對立回應的成對註釋,可以幫助學生進行有效論證寫作所必需的批判性閱讀與立場採擇。
雖然共享註釋能讓個別讀者受益,「但自 1920 年代以來,識讀理論日益強調社會因素在識讀能力發展中的重要性。」因此,共享註釋不僅能幫助人更佳理解特定文本的內容,也可能有助於識讀能力的獲得。例如,母親可能會在書中留下標記,以吸引孩子注意特定的主題或概念;由於音訊註釋的發展,父母現在可以為剛開始閱讀且可能對文字註釋感到困難的孩子留下筆記。
近期關於共享文本註釋效果的研究集中在網頁註釋系統的學習應用上,其中一些系統是根據上述研究的設計建議所開發的。例如,Ananda Gunawardena、Aaron Tan 和 David Kaufer 進行了一項先導研究,以檢視在卡內基美隆大學的一門電腦科學課程中,於網頁註釋與社交閱讀平台 Classroom Salon 上註釋文件是否能鼓勵積極閱讀、錯誤偵測與協作。該研究顯示,學生在課程中的整體表現與他們在 Classroom Salon 中註釋文本時識別錯誤的能力之間存在關聯;研究也發現,學生可能會因應課程中其他人所做的註釋而修改自己的註釋。
同樣地,網頁註釋工具 HyLighter 被應用於大一寫作課程中,並證明能改善學生對文本心智模型的發展,包括支持閱讀理解、批判性思維及發展論文主張的能力。與同儕及專家圍繞共享文本的協作,提升了這些技能,並使社群的理解更趨一致。
一項針對社交註釋(SA)工具在高等教育用途的實證研究之後設分析指出,這類工具已在多種課程中進行測試,包括英語、運動心理學與超媒體。研究顯示,社交註釋功能,包括評論、資訊分享與螢光標示,可以支援旨在促進協作學習與溝通的教學,並有助於閱讀理解、後設認知與批判性分析。多項研究指出,學生喜歡使用社交註釋工具,且這提升了他們在課程中的動機。
「多感官」註釋也被發現不僅有助於學生在課堂上記憶資訊,還能幫助那些正在學習新語言的人。可以在單字旁放置或連結圖片,讓人們透過觀看來更佳理解該單字的意思。同樣地,也可以用音訊片段來呈現單字的發音及其意義。當然,這在使用科技時更容易實現,且為了明確屬於註釋,它必須嵌入在被參照的文件中。然而,在實體文本中,在單字旁畫一張圖仍然是一種感官註釋。這種註釋形式能促進理解,特別是在課堂上,因為它需要學生動用更多腦力來記憶所給予的資訊。
寫作與以文本為中心的協作
文本註釋長期以來在寫作與修訂過程中被用作審閱者提出修改建議和就文本進行溝通的方式。例如,在圖書出版中,作者與編輯合作開發與修訂手稿的過程,常涉及行內修訂或筆記以及頁邊註釋的交流。同樣地,文稿編校常會做頁邊註釋或筆記,以解釋或建議修訂,或是以問題或建議的形式(通常稱為「詢問」)向作者提出。非同步協作寫作與文件開發常依賴文本註釋,不僅用於建議修訂,也用於在文件開發過程中交流想法或促進群體決策,儘管這些過程常因針對不同任務使用不同的溝通技術(如電話或電子郵件以及文件共享)而變得複雜。文本註釋也可以讓群體或社群成員就共享文本進行溝通,例如醫生在病患的病歷上做註釋。
許多關於協作式資訊科技寫作系統(常支援文本註釋)的功能與設計研究,都發生在電腦支援協同工作領域。
語言學標註
在語料庫語言學、數位文獻學和自然語言處理中,標註被用來闡釋文本(或其他自然語言的數位表示)的語言、文本或其他特徵。在語言學中,標註包括評論和後設資料;非轉錄性標註也屬於非語言學範疇。
在這些學科中,標註是量化研究、實證研究與機器學習應用的基礎。與上述用途中非常稀疏出現的註釋不同,語言學標註通常要求文本中的每個元素(詞元)都帶有一個或多個標註,且不同標註之間存在複雜的關係。為此目的存在許多專門的格式(和工具),以下說明了在 Universal Dependencies 專案中使用的一種標註。為求清晰,通常使用的定位字元分隔值已被 HTML 表格取代。
該範例的視覺化呈現如圖 2 所示。除了詞級標註外,在此格式中,詞(以及句子等)也可以帶有後設資料。
還存在其他各種標註格式,通常與特定的軟體工具相結合,用於創建、處理或查詢,可參見 Ide 等人(2017)的綜述。Linguistic Annotation Wiki 描述了用於創建和管理語言學標註的工具與格式。在「重疊標記」和「網頁註釋」下也討論了特定的問題與應用。除了定位字元分隔值和其他文本格式外,語言學標註的格式常基於標記語言,如 XML(及早期的 SGML),更複雜的標註也可能採用基於圖形的資料模型與格式,如 JSON-LD,例如遵循 Web Annotation 標準。
語言學標註有其獨立的研究傳統與術語:標註的目標通常被稱為「可標記項」(markable),標註的內容被稱為「標註」(annotation),標註與可標記項之間的關係通常在標註格式中表達(例如,將標註與文本並列),因此不需要明確的錨點。
結構與設計
註釋系統的設計與開發研究使用特定術語來指代註釋的不同結構組件,並區分數位註釋顯示的選項。
註釋結構
任何註釋的結構組件大致可分為三個主要元素:本體(body)、錨點(anchor)與標記(marker)。註釋的本體包括讀者生成的符號和文本,例如手寫的評論或頁邊的星號。錨點指示註釋本體所指的原始文本範圍;它可能包括圈選部分、括號、螢光標示、底線等。註釋可以錨定到非常廣泛的文本段落(如整份文件),也可以錨定到非常狹窄的部分(如特定的字母、單詞或片語)。標記是錨點的視覺外觀,例如是灰色底線還是黃色螢光標示。一個有本體(如頁邊的評論)但沒有特定錨點的註釋,就沒有標記。
註釋顯示類型
基於資訊科技的註釋系統利用多種顯示選項來呈現註釋,包括:
- 註腳介面:在相應文本下方顯示註釋
- 對齊註釋:在文本頁邊垂直顯示評論與筆記,有時會以多欄或「側邊欄」圖層的形式呈現
- 行間註釋:將註釋直接附加到文本中
- 便利貼介面:註釋以彈出式對話框的形式出現在源文本上方
- 語音註釋:審閱者錄製註釋並將其嵌入文件中
- 筆式或數位墨水介面:允許直接在文件或螢幕上書寫
註釋介面也可能允許螢光標示或底線,以及討論串。透過錨定於特定文件的註釋進行分享與溝通,有時被稱為錨定討論。
文本註釋技術
- 文本Category:此技術常用於網頁搜尋引擎、文件管理系統及其他自然語言處理應用中。
- 語意標註:用於理解語言的意義與脈絡。它也可用於提高採用自然語言處理的機器學習演算法的準確性。
- 片語組塊:透過註釋與標籤將詞語分組成有意義的組塊。
- 實體連結:此過程將文本中的實體連結到知識庫中的特定項目。
基於資訊科技的文本註釋系統
基於資訊科技的註釋系統包括獨立系統和主從式系統。在 1980 年代與 1990 年代,許多此類系統是在圖書館、專利局和法律文本處理的背景下建立的。它們的設計促使研究人員產生了註釋形式的分類法。文本註釋的研究曾在多家機構進行,包括帕羅奧圖和格勒諾布爾(法國)的 Xerox 研究中心、日立中央研究所(特別是針對專利註釋),以及在 1989 年至 1995 年間,與法國新國家圖書館建設相關的土魯斯資訊科學研究所和 AIS(Advanced Innovation Systems)公司。
註釋功能多年來一直存在於文本處理軟體中,透過以彈出視窗、註腳和章節附註形式顯示的行內筆記呈現;然而,直到最近,以頁邊旁註形式顯示註釋的功能才出現在 OpenOffice.org/LibreOffice Writer 和 Microsoft Word 等程式中。個人或獨立的註釋軟體包括支援嵌入式或錨定文本註釋的文書處理軟體,以及 Adobe Acrobat,後者除了評論外,還允許螢光標示、圖章和其他類型的標記。
網頁文本註釋系統
Tim Berners-Lee 早在 1990 年就在史上第一個網頁瀏覽器 WorldWideWeb 中實現了直接編輯網頁文件的概念,但後來的移植版本移除了這項協作功能。1993 年 NCSA Mosaic 的一個早期版本也包含協作註釋功能,但很快就被移除了。後來,Web Distributed Authoring and Versioning (WebDAV) 作為擴充功能被重新引入。
一種不同的分散式創作方法是,首先從廣大公眾中收集大量註釋,然後將它們全部整合以產生文件的下一個版本。這種方法由 Stet 系統開創,該系統是為收集 GNU 通用公共授權條款第 3 版草案的評論而設立的。該系統因應一項特定需求而生,並出色地完成了任務,但其配置不易,不便於註釋網頁上的任何其他文件。co-ment 系統使用了與 Stet 相似的註釋介面概念,但它基於一個全新的實作,在伺服器端使用 Django/Python,在用戶端使用 JQuery 等各種 AJAX 函式庫。Stet 和 co-ment 均以 GNU Affero 通用公共授權條款授權。
自 2011 年以來,非營利組織 Hypothes.is Project 提供了免費、開放的網頁註釋服務 Hypothes.is。該服務的特色是透過 Chrome 擴充功能、書籤小程式或代理伺服器進行註釋,並可整合到學習管理系統(LMS)或內容管理系統(CMS)中。網頁和 PDF 檔案皆可註釋。其他網頁文本註釋系統是分散式文本編輯與版本控制的協作軟體,也具備註釋與評論介面。
在科學出版領域存在專門的網頁文本註釋,用於審稿或出版後評論。由公共科學圖書館(Public Library of Science)出版的線上期刊 PLoS ONE 開發了自己的網頁系統,科學家與公眾可以在此評論已發表的文章。這些註釋以彈出視窗的形式顯示,並在文本中有一個錨點。
參見
- 註釋
- 網頁註釋
- 評註(註釋)
- 行間評註
- 註腳
- Perusall
- PDF註釋
- 頁邊旁註
- 社交書籤
- 註解(電腦程式設計)