AI賦能選題策劃7天完成一本書?! 出版業(yè)務進一步被AI顛覆
■受訪人:梁 翃(北京看山科技有限公司創(chuàng)始人) □采訪人:孫 玨(中國出版?zhèn)髅缴虉笥浾撸?/strong>
去年9月,本報記者采訪了北京看山科技有限公司創(chuàng)始人梁翃,聚焦“AI繪圖已將復雜的人工繪圖成本降低80%以上”話題,引起業(yè)界強烈反響(鏈接:2023年9月1日11版)。時隔一年,AI在出版行業(yè)的應用有更進一步突破,如有出版機構設置“單獨部門”統(tǒng)籌AI出版試驗,但更多的是以出版從業(yè)者個人的“工作輔助”性嘗試居多,未形成大規(guī)模的出版機構頂層設計案例。而在為數(shù)不同的能垂直賦能出版行業(yè)全產(chǎn)業(yè)鏈的案例中,看山科技用1年時間迭代了自己的服務能力。據(jù)記者了解,今年該公司的AI技術應用實踐除了降低圖書插畫環(huán)節(jié)的成本外,在文稿加工、編輯校對、選題策劃、圖書嵌入AI人機對話、營銷數(shù)字人等多個維度實現(xiàn)了行業(yè)落地。
看山科技是一家教育內(nèi)容公司,在教育信息化領域耕耘了近12年,之前做短視頻內(nèi)容,做了約3萬個短視頻和10萬的微課和近300萬的教學資源,服務超3000所學校。2022年開始接觸AIGC,并很快利用AIGC調(diào)整了業(yè)務方向,目前有三大板塊:“瘋鳥AI”品牌,為出版等行業(yè)提供設計服務;愛奇多親子AI藝術課程,培養(yǎng)孩子的想象力和創(chuàng)造力;職業(yè)教育AIGC行業(yè)應用課程,賦能職業(yè)學校,培養(yǎng)新一代職場人。
□目前,看山科技在提升圖書插畫效率方面達到的最好水準是怎樣的?
■插畫效率的提升跟插畫類型有關,相對而言,效率達到10倍問題不大。效率提升最高的插圖類型是標準化插畫,如詞匯類、字典類配圖,畫面風格統(tǒng)一、插畫內(nèi)容簡單不需要復雜的場景、動作、表情,這樣的插畫類型相對于人工效率提升,可達百倍以上。我們現(xiàn)在的設計團隊只有10個人,他們1個月可以畫1萬張圖。相對于原有人工插畫師,平均效率提升10~30倍。極致情況下我們出一套書的插圖,一臺電腦一天可出5000張圖,是指同事下班電腦自動出圖,早上收到就可以開始篩選圖。非常多的事情已經(jīng)有變化。我原來找插畫師要求畫功好,現(xiàn)在一定要有很好的審美力和選圖能力,要選出最好的圖以及最少人工修改的圖。
□與哪些出版機構達成了插畫層面的合作?
■我們與知識出版社合作了中學生文學讀物,與童趣出版公司合作了繪本插圖設計,和吉林科技出版社合作了兒童科普圖書,和中國少年兒童新聞出版總社合作了期刊內(nèi)頁設計,與吉林出版集團外語公司合作了“快樂讀書吧”叢書插圖設計。目前,AI能夠覆蓋的插圖類型越來越廣泛,除了科學性較強的工程類、醫(yī)學類等專業(yè)圖書外,可以覆蓋大部分圖書類型。
□看山科技在文稿加工、選題策劃方面可以達成什么樣的效果?
■我們作為一家成立了十年以上的內(nèi)容公司,2022年年底就開始用AI進行文稿撰寫。最初和大家的感覺一樣,覺得AI撰稿很難達到預期,但在不斷實踐中,通過prompt的優(yōu)化以及工具的組合運用,目前在課程開發(fā)、圖書文稿、營銷文章上已廣泛應用了AI工具。我們與人民郵電出版社合作的圖書已用到AI工具做選題開發(fā)和文稿梳理。從時間上來看,他們大概用了一周時間,完成內(nèi)容框架的搭建和圖書文稿內(nèi)容撰寫。
□內(nèi)容策劃方面,能否列舉一些實操案例談談落地實踐?
■我們做了“愛奇多親子AI藝術課程”。利用AI工具讓孩子學畫畫,通過使用AI創(chuàng)作工具,孩子們可以自由創(chuàng)作各種藝術作品,同時訓練了思維能力、表達能力和美學素養(yǎng)。每次創(chuàng)作好像是在創(chuàng)作一個小作文,孩子們學會了描述人物時要有表情動作,描述景色要加光線、角度等。這個平臺只有兩個按鈕,一個是說話鍵,一個是發(fā)送鍵,孩子通過這兩個環(huán)節(jié)可以完成整個創(chuàng)作過程。目前,這套課程有3000名學員完成了學習。未來,超級個體的小朋友拿起筆就能寫故事,創(chuàng)造很好的音樂,借助AI創(chuàng)造非常感人的畫作,這樣的小朋友在下一個時代會大量涌現(xiàn)。
具體來看,我們自己開發(fā)的“愛奇多親子AI藝術課”課程結構由專業(yè)教研人員設計,但課程中講解的口播稿都是借助AI生成的。同時,課程中的很多環(huán)節(jié),例如“跟著兒歌學名畫”,借助AI為每個藝術大師生成新的數(shù)字內(nèi)容,同時我們也運用文生音樂工具生成兒歌。孩子們可以一邊跟著兒歌哼唱,一邊欣賞名畫中的美好場景。這門課程的內(nèi)容又在AI輔助下,改編成圖書,即將在7月出版上市。
□ 從看山科技的實踐看,圖書嵌入AI人機對話已在哪些圖書上使用?
■我們剛剛開發(fā)了一款新產(chǎn)品,叫圖書精靈。簡單說就是讀者買到書后掃描二維碼或特定圖案,從而激活一個自定義形象數(shù)字人,這個數(shù)字人可以是出版機構的IP,也可以是書中的人物。讀者可以與數(shù)字人就圖書內(nèi)容進行自由對話。這種形式大大改變了讀者閱讀圖書的方式,同時當讀者的問題超出書籍對應主題時,圖書精靈還可以推送相應其他圖書的購買鏈接,對于出版機構而言也是很好的營銷推廣。目前來看,知識類圖書,如專業(yè)書、科普書、教材教輔類圖書,都很適合圖書精靈的應用。我們甚至認為,未來會有相當比例的圖書,有類似圖書精靈這樣的“AI inside”鏈接。
□ 圖書嵌入AI知識模塊,是否會涉及到其他圖書或內(nèi)容領域的侵權?
我們推出的圖書精靈所“投喂”的語料,在沒有得到授權前提下,不會直接應用圖書內(nèi)容,而是圍繞所嵌入圖書的主題,進行知識圖譜的重新構建和語料梳理,設計成對應每本書的本地知識庫,供AI工具調(diào)用。但針對類似產(chǎn)品,目前國家還沒有相關約束性法規(guī)出現(xiàn),是否市場上會出現(xiàn)大量侵權語料內(nèi)容,我們也持憂慮態(tài)度。
□AI需要不斷用數(shù)據(jù)喂養(yǎng),如何做到相關圖書知識模塊構建過程中,不斷迭代?
■圖書精靈還只是一個常識性產(chǎn)品,在這個過程里需要進行本地知識庫的搭建和數(shù)字人制作、調(diào)用等多個過程,需要用到多種AI工具組合,我們也會在后續(xù)服務過程中不斷迭代。
□看山科技在為出版機構服務過程中,擁有自己的技術平臺還是以工具綜合調(diào)用為主?
■我們并未開發(fā)自己的技術平臺,秉持應用領先的價值觀,我們更喜歡綜合調(diào)用多種AI工具解決客戶的各種問題。AI正在高速發(fā)展階段,為了解決客戶在垂直場景中的具體問題,我們會隨時評測、嘗試最新AI工具以及構建更加合理的工作流來提升服務品質(zhì)??瓷綋碛凶约旱膶I(yè)技術團隊,在安全性和穩(wěn)定性上會給客戶提供最好保障。
□輔助出版機構進行營銷數(shù)字人的制作和應用情況如何?成本如何?
■我們在圖書精靈產(chǎn)品和新媒體營銷環(huán)節(jié)應用到了數(shù)字人。目前數(shù)字人的制作成本幾乎可以忽略不計。當然,如果從營銷角度,出版機構需要設計自己專屬的IP形象,成本還是有一些,根據(jù)IP形象的要求成本略有不同,不過應該完全在出版機構的可接受范圍內(nèi)。
□現(xiàn)在AI工具的使用在出版流程中已經(jīng)順暢了嗎?
■是的,我們從文稿撰寫、插圖繪制、版式設計、文章翻譯、校對、融媒體內(nèi)容制作、圖書及課程新媒體營銷等環(huán)節(jié)已經(jīng)非常順暢地應用到多種工具。
□出版行業(yè)的圖書制作流程需要多環(huán)節(jié)支撐,您覺得AI目前已經(jīng)可以取代哪些環(huán)節(jié)?
■目前很難說AI取代了哪些環(huán)節(jié),更精準的表達是幾乎每個環(huán)節(jié)都因AI的接入效率大幅提升。我們自己的親身經(jīng)歷是,原有圖書插圖的樣稿環(huán)節(jié),因為AI的超強算力,通??梢砸淮涡蕴峁?shù)十種風格供出版機構挑選,改變了原來的畫樣圖并反復修改的冗長流程。同時,我們一個團隊可以完成文稿撰寫、插圖繪制、版式設計等多個模塊工作,可以大大減少跨團隊溝通成本。同時這也代表著,行業(yè)上下游開始出現(xiàn)整合趨勢,或許未來像看山科技一樣可以綜合提供圖書一體化設計服務的公司會越來越多。
□看山科技是否在幫助大型出版機構做全面構建出版生態(tài)環(huán)境基礎設施?具體涉及哪些環(huán)節(jié)功能?
■目前我們正在與出版領域的幾家上市公司洽談合作,就版權保護、AIGC一體化平臺搭建等方向進行探討。雖然并未有項目開始落地,但已經(jīng)看到這些大型出版機構開始在AI時代承擔起行業(yè)領軍者的角色和使命,相信新的出版生態(tài)構建不會太遲。
□出版行業(yè)的工作模式已經(jīng)發(fā)生了改變?
■從看山的角度,我們公司團隊內(nèi)部組織架構已經(jīng)發(fā)生了變化。原來工作流程是線性結構,從教研人員到文案人員,再到插畫師,最后是動畫視頻工作人員?,F(xiàn)在變成小組,每位小組成員都可以完成包括文稿、插畫在內(nèi)的2~3項工作,小組按照內(nèi)容來劃分,以便成員可以積累同一主題方向的專業(yè)性內(nèi)容。最近有出版社委托我們做一套書,給了我們幾個核心詞匯,我說“你的框架呢”,他說“沒有框架”,我們帶著AI做了一套書籍的整體框架,順利地通過了出版社的審核。從框架到文稿再到插圖到版式,這意味著出版行業(yè)原來一本書需要五六個環(huán)節(jié),包括作者、插畫師、美編、校對、翻譯等等,現(xiàn)在只需要一個人或小組就可以完成。
□您覺得,AI會對哪個出版領域產(chǎn)生迅速且深刻的影響?
■我覺得是教育出版。AI的基本原則是算力、算法和數(shù)據(jù)。教育要思考的是教育目的、教育本質(zhì)、教育方式。更多的創(chuàng)業(yè)者聚焦的是AI對教育方式的改變。比如,我們現(xiàn)在大概每一兩周會測十幾二十種AI工具,包括教育工具,測試了很多。教育內(nèi)容的生成,比如教學設計、教案生成、教學游戲、試卷生成等,這是AI的算法和數(shù)據(jù)結合到一起實現(xiàn)的。然后是個性化學習體驗、個性對話、虛擬空間,也是數(shù)據(jù)和算力可以做的事情。
這些當然很重要,此外,我們做了很多年教育,真正要探討的是“我們要去哪里”。麥肯錫報告提到,2030年應該做什么工作?他們訪問全球很多應用了AI的企業(yè)家和職場人,得出的結果是,他們認為,2030年,在高級認知技能方面情況有些復雜,創(chuàng)造力的需求仍然在高位,預計將增加12%。但其他如高級讀寫和寫作,定量和統(tǒng)計技能需求會下降19%。備受追捧的新技能是社會和情感技能。預計到2030年這些技能在歐洲需求將增加11%,在美國將增長14%。我們的教育體系一直在為社會提供源源不斷的人才,當社會變化時,教育體系可能來不及那么快作出反應,但教育從業(yè)者可以更多思考:我們現(xiàn)在培養(yǎng)的人能適應未來社會嗎?