網路文字分析師-另類的社會觀察家 Jul 28, 2016 — Kevin Wu 網路文字分析師-另類的社會觀察家 最近又面試了新的工作,這個工作算是相關產業較新的團隊,主要工作是對社群評論、網路文章的文字分析,提出觀點與報告,和一般使用的FB、GA等研究社群的方式不同,他們用的不是數據,而是直接人工閱讀文字,來對族群、產品、媒體性質等等提出看法。個人認為這是蠻特別的工作,因此想提出來與大家分享。我會先對其他的分析研究提出一些簡單的看法,並說明他們和社群文字分析有何差別,並且討論此種特別的分析,該如何對其品質、等級、正確性提出可能的衡量,更直接的是,企業該如何看待這類分析,工作者的報酬依據為何?另外,這有沒有可能成為新的分析趨勢,並以新的角度來看待?首先,隨意舉一些分析的例子,像是問卷調查,從起初就會有嚴謹的邏輯,考慮到開放與閉鎖式的問題,並且研究文字是否可能誤導、產生誤會,或著嘗試引導出答案,問卷最重要的就是利用自己的邏輯,提問,來探究人們對事物看法的真實性,最後成為可能的銷售、改善等的切入點。另外最近比較夯的數據分析,則是將蒐機而來的各類數據組合,以數字呈現,利用迴歸、相關性、演算法等方來探究。股票則是運用財務報表中的數字,用邏輯與市場的特性,來判斷公司的品質,或用技術線圖的型態、規律等結果,來作為買賣的依據。另外企業發展、市場研究等分析,通常則是從各方面找證據,最強調故事的前後因果邏輯,來證明某件事情是可行的,做為行動的依據。我相信直接對文字分析,有不同於上述分析的特點,這樣的分析常是以分析著的靈感做為出發,重點並不再某件事情出現的頻率,而是在分析者是否能感受到網路上人們的情緒、看法,雖然每個人各有不同,但是分析者能否歸類、描繪出特點,就會是比較重要的事情,最後依據這樣的感覺搭配數字資料及各方證據,來提出對於產品、市場流行等等的看法,他們可能較少以數字做為依據,就像是問卷中的開放式問題,就是要知道人們實際的感覺,只是他所分析的是,網路上數量龐大的人們,所留下的真實、非真實文字。這樣的分析或許有點類似創意、設計相關的領域,當它們被塑造出來時,都是強調感受到的事物、或事物給人的感受,很難用等級、分數等方式來評量,一個好的設計與創意,雖然久而久之可以歸納出幾個重要的因素,也可以用經驗來做參考,但大抵上要等其被創造,讓它與人接觸之後,透過人們的實際反應,才能知道它們有多討人喜歡、符合受眾想法,大部分的預測都是如此,但對於人們情感的描述而言,這樣的特徵卻更為強烈。當我們越來越能解讀文字之後,或許不論心理學、文字學、社會學、哲學也許都會有重大的突破。而目前也需要去重視這件事情,因為在網路及科學的快速進步之下,我們運用數字、電腦、網路,來取代過去的文字、交談、書信,人們的感受力很明顯變差,但要感受的東西卻變多了,尤其是在網路各個平台上,無數媒體、網友、鄉民的言詞評論,有太多太多的東西,需要被理解與發現,況且我們這些工具平台也正是我們表達自己的所在,要如何去詮釋這些言論,理當是從個人到企業都應該重視的事情,而文字分析者的工作,會是一個新的解決問題的方法。當我們開始認真面對這些分析者時,一定會出現許多質疑,他們的效用到底有多大?究竟能否真實地表達群眾或個人的想法?他們找到的缺口是事實又或是人們所偽造的跡象?這種不太科學的研究方法正確性何在?還有一個很重要問題,一份分析報告,對於企業的價值有多少?也可以說,如何說明某份報告,分析者貢獻了多少成果?當這份報告到商場上時,這是我們勢必要回答的問題。先來說說分析師的報酬該當如何,我想,根據結果來提供報酬應該是最好不過,但結果還需要整體團隊的執行配合,至於分析者占團隊的份量如何,恐怕又是另外一個需要回答的問題,而根據報告的品質來提供也尚可接受,但品質的衡量之後提到的疑慮就必須解決,我想最差的大概就是根據時間與數量,以領月薪或是篇數來給定,相信多數人都不會認同,但企業卻常以這樣的方法來給薪,當然可能是因為前兩個難題,企業無力解決或不願大費周章,而這也是目前勞資雙方目前面臨的難題,並且,固定的給薪是如此方便誘人,無怪乎大抵市場的機制都呈現如此。當然折衷的辦法可能比較能令人信服,透過固定給付與特別產出的獎金我想會是比較好的方式,但某些人並不願意承受這樣的波動風險,或許也是固定薪資難以被取代的原因。在報酬方面,我一直認為是個需要勞資雙方共同努力的協議,根據結果而來的報酬,應該是較為雙方接受的,但就必須認真面對,去解決詳細的合約數字,並考慮到個性﹑公司文化等個面向的影響。在分析報告方面,我想,看過了諸多產業報告、議題、媒體新聞的產出,許多備受重視的報告不外乎有幾個特點,邏輯清晰、資料完整、觀點明確。就邏輯而言,包含了整體文章架構編排、論點前後的因果、詮釋故事的連結性、科學資料的正反應證及實驗的完整性等等,而資料完整不外乎透過歸納或演繹,盡量將重點都涵蓋在裏頭,並且呈現出明確確的數字或是歷史事實。觀點明確則是包含分析者的腳色與立場,切入點與邏輯資料使否一致,最重要的是,對於未來的預測、實用性等等提出看法。我認為這些重要的因子,對於文字報告大部分都適用,但仍然有些疑慮,例如因果的詮釋,透過未必真實的網路資料將大打折扣,甚至有些根本不符合因果,資料的驗證與實驗,除非完整的考量或另行設計,否則似乎無法對廣大的群眾做太科學的研究,我們仍可用經驗以及市場各個切入點來做應證,而由於每個人多少有些差距,將小群受眾的觀點綜合起來,會是比較實際做法。資料的完整性確實可以達到,透過網路與軟體的各項功能,我想我們可以蒐集到不錯的多樣與多量,至於個人或是團隊能否負荷就又是另一回事。而就觀點而言,這是每個分析者都必須擁有的立場,不管是專案團隊提出的疑問、客戶的疑慮等等,分析者都必須具備某種立場來分析,但最難也是最重要的是,報告對於未來的預測與實用性為何?前面提到,某些科學方法及因果論點可能不像過去一樣,能夠有力地支撐起整個報告,參雜的是一些主觀的感受與人性的分析,這樣對於評鑑將有其困難,我們過去可以根據其事實詮釋的周延性來論斷,但當主觀的因素加入後,未來的預測,究竟是科學的方法還是人的直覺正確性高?究竟是有邏輯的論證但未必是事實,還是人的直覺但更接近真實會被接受,前面的各項小因素都可以利用反覆思量,盡量接近可靠,但理性與感性的衝突早已存在,我們該如何看待這種可能無法解決的難題?我們應該盡可能去回答這個問題。我認為文字分析未必能成為趨勢,但這或許會成為針對當代問題所提出的新分析方法,我們透過網路,將大量的群眾濃縮到幾個社群,當我們擁有文字方面的分析力之後,人群的心理及觀點將變成透明,媒體的間接報導、口耳相傳的美化造假、親自面談或觀察勞累,過去間接、不真實、耗費體力的方式可以被替代,更快速、完整地進行分析。而這樣的方法可以用什麼樣的方式來看待,針對前面科學與人性的衝突,我想可以用「文化及道德」的角度來切入,提供一個特別的解法,之所以把文字分析視作文化及道德,是因為這些文字或是圖片的樣貌,終究是來自於人們的文化背景與認知。過去我們嘗試將偏好、實用性、評價、CP值、觀看感受、吸引程度等各項感覺化為數字,例如是對於產品的喜歡程度給與數字評分,手機的耐用性等級,電腦的性價比、網頁瀏覽次數與頻率等等,透過這些數字,來衡量人們的感覺,甚至也用計算文字的數量,來描述個人的好惡、習慣、個性,但似乎卻沒有更人性化的方法,都是以數字、科學的方式來衡量。但是,仍然有些事情我們並沒有用數字或科學的角度去衡量,這也是哲學之所以仍然被世人廣為討論的原因吧,例如道德感、文化優劣、種族、歷史,這些同樣是很人文的東西,仍然保有它的樣貌,但我們卻可以輕鬆地去描述或去表示認同或反對,就道德而言,鮮少有人會去將人的道德感打分數,但我們仍會說隨地丟垃圾是不道德的,但對與某些國家而言,或許丟垃圾又沒有這麼不道德,將「丟垃圾」 換成「插隊」而言也將是如此,而對於膚色的美感、不同種族的五官,人們都會用不同的方式去看待,他們有自己的觀點和衡量的習慣,並且也成為各文化地域中普世的能力。或許,文字分析師該讓網路文化成為自己可以隨時抽離的一部份,也就是成為生活在各個網路文化的人,如此當在跨論壇(跨地域)時的文字表達(語言)及習慣(當地文化),都可以用不同的切入點(道德觀)來說明其對產品(丟垃圾)的看法,如此,他們的能力將不限於文字的分析,而是跨大到文化及感覺的論述,對於同樣的評語在不同網站上可以詮釋成不同的觀點,在不同的媒體上,即便兩個極端的評價也可能說明著相同的看法,文字分析師,可能會進化成網路上的社會觀察家,去描繪跨地區的文化、道德、歷史是如何運作。因此,文字分析師,該成為的或許不會是網路上的文字科學家,而是網路中的社會觀察家,重點不會放驗證資料的吻合性、數字多寡,而是在人性、習慣及環境的描繪以及特殊價值觀和歷史的建構。而企業不該只重視其產出的邏輯與觀點,亦當在乎一篇篇故事所呈現的,是否有把握各個文化的差異,並提供真實的社群樣貌。
網路文字分析師-另類的社會觀察家
— Kevin Wu
網路文字分析師-另類的社會觀察家
最近又面試了新的工作,這個工作算是相關產業較新的團隊,主要工作是對社群評論、網路文章的文字分析,提出觀點與報告,和一般使用的FB、GA等研究社群的方式不同,他們用的不是數據,而是直接人工閱讀文字,來對族群、產品、媒體性質等等提出看法。個人認為這是蠻特別的工作,因此想提出來與大家分享。我會先對其他的分析研究提出一些簡單的看法,並說明他們和社群文字分析有何差別,並且討論此種特別的分析,該如何對其品質、等級、正確性提出可能的衡量,更直接的是,企業該如何看待這類分析,工作者的報酬依據為何?另外,這有沒有可能成為新的分析趨勢,並以新的角度來看待?
首先,隨意舉一些分析的例子,像是問卷調查,從起初就會有嚴謹的邏輯,考慮到開放與閉鎖式的問題,並且研究文字是否可能誤導、產生誤會,或著嘗試引導出答案,問卷最重要的就是利用自己的邏輯,提問,來探究人們對事物看法的真實性,最後成為可能的銷售、改善等的切入點。另外最近比較夯的數據分析,則是將蒐機而來的各類數據組合,以數字呈現,利用迴歸、相關性、演算法等方來探究。股票則是運用財務報表中的數字,用邏輯與市場的特性,來判斷公司的品質,或用技術線圖的型態、規律等結果,來作為買賣的依據。另外企業發展、市場研究等分析,通常則是從各方面找證據,最強調故事的前後因果邏輯,來證明某件事情是可行的,做為行動的依據。
我相信直接對文字分析,有不同於上述分析的特點,這樣的分析常是以分析著的靈感做為出發,重點並不再某件事情出現的頻率,而是在分析者是否能感受到網路上人們的情緒、看法,雖然每個人各有不同,但是分析者能否歸類、描繪出特點,就會是比較重要的事情,最後依據這樣的感覺搭配數字資料及各方證據,來提出對於產品、市場流行等等的看法,他們可能較少以數字做為依據,就像是問卷中的開放式問題,就是要知道人們實際的感覺,只是他所分析的是,網路上數量龐大的人們,所留下的真實、非真實文字。這樣的分析或許有點類似創意、設計相關的領域,當它們被塑造出來時,都是強調感受到的事物、或事物給人的感受,很難用等級、分數等方式來評量,一個好的設計與創意,雖然久而久之可以歸納出幾個重要的因素,也可以用經驗來做參考,但大抵上要等其被創造,讓它與人接觸之後,透過人們的實際反應,才能知道它們有多討人喜歡、符合受眾想法,大部分的預測都是如此,但對於人們情感的描述而言,這樣的特徵卻更為強烈。
當我們越來越能解讀文字之後,或許不論心理學、文字學、社會學、哲學也許都會有重大的突破。而目前也需要去重視這件事情,因為在網路及科學的快速進步之下,我們運用數字、電腦、網路,來取代過去的文字、交談、書信,人們的感受力很明顯變差,但要感受的東西卻變多了,尤其是在網路各個平台上,無數媒體、網友、鄉民的言詞評論,有太多太多的東西,需要被理解與發現,況且我們這些工具平台也正是我們表達自己的所在,要如何去詮釋這些言論,理當是從個人到企業都應該重視的事情,而文字分析者的工作,會是一個新的解決問題的方法。
當我們開始認真面對這些分析者時,一定會出現許多質疑,他們的效用到底有多大?究竟能否真實地表達群眾或個人的想法?他們找到的缺口是事實又或是人們所偽造的跡象?這種不太科學的研究方法正確性何在?還有一個很重要問題,一份分析報告,對於企業的價值有多少?也可以說,如何說明某份報告,分析者貢獻了多少成果?當這份報告到商場上時,這是我們勢必要回答的問題。
先來說說分析師的報酬該當如何,我想,根據結果來提供報酬應該是最好不過,但結果還需要整體團隊的執行配合,至於分析者占團隊的份量如何,恐怕又是另外一個需要回答的問題,而根據報告的品質來提供也尚可接受,但品質的衡量之後提到的疑慮就必須解決,我想最差的大概就是根據時間與數量,以領月薪或是篇數來給定,相信多數人都不會認同,但企業卻常以這樣的方法來給薪,當然可能是因為前兩個難題,企業無力解決或不願大費周章,而這也是目前勞資雙方目前面臨的難題,並且,固定的給薪是如此方便誘人,無怪乎大抵市場的機制都呈現如此。當然折衷的辦法可能比較能令人信服,透過固定給付與特別產出的獎金我想會是比較好的方式,但某些人並不願意承受這樣的波動風險,或許也是固定薪資難以被取代的原因。在報酬方面,我一直認為是個需要勞資雙方共同努力的協議,根據結果而來的報酬,應該是較為雙方接受的,但就必須認真面對,去解決詳細的合約數字,並考慮到個性﹑公司文化等個面向的影響。
在分析報告方面,我想,看過了諸多產業報告、議題、媒體新聞的產出,許多備受重視的報告不外乎有幾個特點,邏輯清晰、資料完整、觀點明確。就邏輯而言,包含了整體文章架構編排、論點前後的因果、詮釋故事的連結性、科學資料的正反應證及實驗的完整性等等,而資料完整不外乎透過歸納或演繹,盡量將重點都涵蓋在裏頭,並且呈現出明確確的數字或是歷史事實。觀點明確則是包含分析者的腳色與立場,切入點與邏輯資料使否一致,最重要的是,對於未來的預測、實用性等等提出看法。
我認為這些重要的因子,對於文字報告大部分都適用,但仍然有些疑慮,例如因果的詮釋,透過未必真實的網路資料將大打折扣,甚至有些根本不符合因果,資料的驗證與實驗,除非完整的考量或另行設計,否則似乎無法對廣大的群眾做太科學的研究,我們仍可用經驗以及市場各個切入點來做應證,而由於每個人多少有些差距,將小群受眾的觀點綜合起來,會是比較實際做法。資料的完整性確實可以達到,透過網路與軟體的各項功能,我想我們可以蒐集到不錯的多樣與多量,至於個人或是團隊能否負荷就又是另一回事。而就觀點而言,這是每個分析者都必須擁有的立場,不管是專案團隊提出的疑問、客戶的疑慮等等,分析者都必須具備某種立場來分析,但最難也是最重要的是,報告對於未來的預測與實用性為何?前面提到,某些科學方法及因果論點可能不像過去一樣,能夠有力地支撐起整個報告,參雜的是一些主觀的感受與人性的分析,這樣對於評鑑將有其困難,我們過去可以根據其事實詮釋的周延性來論斷,但當主觀的因素加入後,未來的預測,究竟是科學的方法還是人的直覺正確性高?究竟是有邏輯的論證但未必是事實,還是人的直覺但更接近真實會被接受,前面的各項小因素都可以利用反覆思量,盡量接近可靠,但理性與感性的衝突早已存在,我們該如何看待這種可能無法解決的難題?我們應該盡可能去回答這個問題。
我認為文字分析未必能成為趨勢,但這或許會成為針對當代問題所提出的新分析方法,我們透過網路,將大量的群眾濃縮到幾個社群
,當我們擁有文字方面的分析力之後,人群的心理及觀點將變成透明,媒體的間接報導、口耳相傳的美化造假、親自面談或觀察勞累,過去間接、不真實、耗費體力的方式可以被替代,更快速、完整地進行分析。而這樣的方法可以用什麼樣的方式來看待,針對前面科學與人性的衝突,我想可以用「文化及道德」的角度來切入,提供一個特別的解法,之所以把文字分析視作文化及道德,是因為這些文字或是圖片的樣貌,終究是來自於人們的文化背景與認知。
過去我們嘗試將偏好、實用性、評價、CP值、觀看感受、吸引程度等各項感覺化為數字,例如是對於產品的喜歡程度給與數字評分,手機的耐用性等級,電腦的性價比、網頁瀏覽次數與頻率等等,透過這些數字,來衡量人們的感覺,甚至也用計算文字的數量,來描述個人的好惡、習慣、個性,但似乎卻沒有更人性化的方法,都是以數字、科學的方式來衡量。但是,仍然有些事情我們並沒有用數字或科學的角度去衡量,這也是哲學之所以仍然被世人廣為討論的原因吧,例如道德感、文化優劣、種族、歷史,這些同樣是很人文的東西,仍然保有它的樣貌,但我們卻可以輕鬆地去描述或去表示認同或反對,就道德而言,鮮少有人會去將人的道德感打分數,但我們仍會說隨地丟垃圾是不道德的,但對與某些國家而言,或許丟垃圾又沒有這麼不道德,將「丟垃圾」 換成「插隊」而言也將是如此,而對於膚色的美感、不同種族的五官,人們都會用不同的方式去看待,他們有自己的觀點和衡量的習慣,並且也成為各文化地域中普世的能力。或許,文字分析師該讓網路文化成為自己可以隨時抽離的一部份,也就是成為生活在各個網路文化的人,如此當在跨論壇(跨地域)時的文字表達(語言)及習慣(當地文化),都可以用不同的切入點(道德觀)來說明其對產品(丟垃圾)的看法,如此,他們的能力將不限於文字的分析,而是跨大到文化及感覺的論述,對於同樣的評語在不同網站上可以詮釋成不同的觀點,在不同的媒體上,即便兩個極端的評價也可能說明著相同的看法,文字分析師,可能會進化成網路上的社會觀察家,去描繪跨地區的文化、道德、歷史是如何運作。
因此,文字分析師,該成為的或許不會是網路上的文字科學家,而是網路中的社會觀察家,重點不會放驗證資料的吻合性、數字多寡,而是在人性、習慣及環境的描繪以及特殊價值觀和歷史的建構。而企業不該只重視其產出的邏輯與觀點,亦當在乎一篇篇故事所呈現的,是否有把握各個文化的差異,並提供真實的社群樣貌。
目錄