亞馬遜review中包含著客戶真實的情緒反饋,增長后的數據分析也很重要。
挖掘評論并加以分析voc(客戶之聲)可以使企業更準確、更有效地滿足客戶的期望,從而提高市場份額和客戶忠誠度。能夠讓企業在日益激烈的市場環境中,將有限的資源集中在更有可能被消費者選擇和滿意產品上,而不是浪費在可能失敗的產品上。這種方法也會幫助企業節省成本。且與消費者創造了更好的情感鏈接。積極響應客戶之聲也會提高客戶留存,增加客戶對品牌的忠誠度與參與度。對當下如此高的獲客成本和客戶留存成本環境來說,這些好處不容小覷。
shulex voc 通過absa(細粒度情感分析)模型,進行voc的深度分析。
一、什么是absa?
absa是基于方面的情緒分析(aspect-based sentiment analysis, absa),是一個重要的細粒度情感分析問題,旨在分析和理解人們在方面層面的觀點,在過去的十年中受到了廣泛的關注。在不同的場景中處理absa,引入了不同的任務來分析不同的情感元素及其關系,包括方面術語、方面類別、觀點術語和情感極性。
例如在淘寶中,這里對于評論信息的抽取就是典型的細粒度情感分析,買家對于手機幾個方面的評價有正有負。對細粒度的aspect進行分析,一方面,有助買的人從自己看重的特征方面決定是否購買,另一方面,讓廠家能對自身的產品有更全面的認知,從而進行針對性的改進。可以預想到這樣的信息抽取比單純的抽取喜歡/不喜歡更加具有應用價值。
absa中,要體現出情感的是句子中的某個實體或者實體的某個方面,而不再是整個句子。例如手機是正品,但網絡不穩定中的“正品,網絡”可以看做是方面。
二、普通情感分析與absa的區別
普通情感分析(general sentiment analysis)
主要包含兩部分:目標(target)和情感(sentiment),目標可以是任意一個實體或實體的任意一個方面,情感有積極/中立/消極(positive/neutral/negative)三種觀點(opinion),這里的情感只針對目標。簡單來說就是針對一個文本分析出其對應的情感,是一個非常簡單的文本分類任務。
absa(aspect-based sentiment analysis)
target可以是一個aspect category或一個aspect term,absa中的sentiment進一步擴展為opinion term和大體情緒取向(情感極性)。
二者區別圖示如下:
可以看到absa主要是擴展了方面類別和方面觀點和觀點項。
舉個例子:
“我很想買這個產品,因為我非常喜歡它的設計,但它的價格不是很好。”
absa系統在這里的目標是識別兩個方面:
設計和價格,以及它們相關的情緒。
換句話說,設計:正面,價格:負面。
同一個文本中,不同的方面可以有不同的情感。在這個意義上,absa的輸出并不意味著是對文本中所表達的情感的一般指示,而是旨在提供一個更細化和詳細的信息。
通過一張圖快速學習一下absa中的4個關鍵情感元素:方面項(aspect term)、方面類別(aspect category)、觀點項(opinoin term)、情感極性(sentiment polarity):
三、absa的四個關鍵挑戰
從語言的角度來看,自動識別方面和相關情感的任務是一件不太容易的事情,因為語言是復雜的,很多時候不容易解釋和理解。識別正確的方面更是尤為困難,因為客戶可以從多維度表達他們的意見(例如:對于產品的價格、質量、性能、設計、用途等...)。另一方面,在消費者反饋中識別情緒相對容易,因為情緒通常只分為三類——正面、負面或中立。但檢索與方面相關的正確情緒也可能很棘手。根據不同情況,在進行基于方面的情感分析時,我們會遇到以下挑戰:
1.當情緒來源于產品時:
顧客會明確表達他們對產品或服務的贊賞與不滿。
例如:通過寫正面的形容詞(好、不錯、太棒了)或負面的形容詞(壞、糟糕、可怕)。
也會簡單強調產品的一些特征或通過對產品功能的描述來表達情感。例如:
·電池持續時間長。
·烤箱升溫很快。
·脫毛器能拉動毛發。
這些例子可以被解釋為“積極的”產品特征(一個確實能用很長時間的電池被認為是“質量好”的),但如果在文本中使用類似的表達方式而不明確提及產品,它們就會產生歧義。例如:
a1. 它持續的時間長。
b1. 它升溫很快。
c1. 它能拉動頭發。
上述例子并沒有清楚地表明所指的確切產品或服務是什么。如果文本a1指的是“排隊”,b1指的是“手機”,或者c1指的是“剃須刀”呢?那么情緒就會是“消極的”。因此,“加熱很快”這個表達方式既可以是積極的,也可以是消極的,這取決于它所提到的產品(烤箱或手機)。這就是為什么我們對產品本身的了解對于正確識別情感是至關重要的。
在shulex voc,我們會根據產品的特點定制我們的標簽樹,以便正確檢測出想要傳達的情感。
2.當情緒取決于目標時:
在描述一個產品或服務時,客戶也可以參考其他實體。比如說:
“這個產品的價格不錯,我哥哥買的那個設計也不錯。”
在這個例子中,系統能夠檢索到文本中提到的所有方面及其相關的情感(如價格:正面,設計:正面)這些是不夠的。
重要的是系統只能選擇:“價格:正面”這一對,因為它是與被檢查的產品有關的。“設計:正面”這一對不應該被選擇,因為它指的是一個不同的實體。
從另一個角度來看,機器需要能夠將“目標”(當前分析的主要產品/服務)與其他實體區分開來。為了應對這種挑戰,shulex voc的nlp引擎提供了可以在文本中提到但實際上與分析無關的實體的指示(在上述例子中,“我哥哥買的那個”)。
3.當情緒取決于評級時:
有時,客戶寫反饋時沒有在文本中明確說明情緒。這種情況普遍會出現在問卷調查中,公司要求客戶填寫問卷:對產品/服務進行評級,同時寫下評論。
評級代表了對產品/服務的總體情緒,分數通常從1到10不等。1是“最負面”的情緒,10是“最正面”的情緒。但客戶在寫反饋意見時其實很少會在文本中明確說明某種情緒。
例如:客戶在問卷中的回答是陳述其喜歡/不喜歡的方面,沒有任何文本元素可以幫助識別這串文本的情感。
問題1:您如何評價我們的服務?
評價答案:10分
問題2:哪項服務給你帶來的感受最好?
文字性回答:客戶關懷
顧客在回答問題時,會提到服務的一個相關特征,但沒有在正文中表達意見的取向。因此,只考慮文本呈現出的答案,就不可能確定他們對這方面的真實情緒。
如果對評級進行打標,就有可能檢索到更完整的信息。簡短的回答“客戶關懷”與一個等于10的評級相關。我們可以把文本信息和評級結合起來,推斷出作者對客戶關懷的贊賞。如果評分是“3”,我們就會把這個反饋解釋為一個負面的。
在shulex voc中,我們可以通過將沒有情感的結構化反饋文本與客戶提供的評級聯系起來來管理這種反饋。從而對情感評級進行打標,并對反饋進行完整的分析。
4.當情感不像它看起來那樣時:
到目前為止,我們已經看到了一些反饋文本的常規案例,在這些文本中情感可以被被隱含地傳達(通過我們對產品的了解被檢索出來),明確地傳達(但有時并不是指我們的目標),或者完全沒有傳達出(由于非文本信息而被傳達例如問卷)。
還有一種有趣的情況,在這種情況下情感是明確傳達的,但所傳達出的情感并不是字面意思。主要是用來諷刺。在這種情況下,真正的情感與在文本層面上傳達的情感是相反的。例如:
這把牙刷三天后壞了!真的太棒了!
如果您正在尋找皮膚刺激,那就太好了!
雖然“真的太棒了”和“太好了”這兩個表達方式本身顯然是積極的,但從上下文來看,顧客想表達的是相反的情緒,因此給出了消極的反饋。這種例子強烈依賴于上下文,還要結合語言的理解才能甄別出來。
在shulex voc,我們會不斷檢查那些評級與文本級別的識別情緒不匹配的樣本。手動抽樣檢查低評級評論(即具有整體負面情緒的評論),對樣本進行手動微調步驟使我們能夠檢索到客戶反饋中所傳達的真實情感。并提高識別準確率。
電磁閥智能化方向上的發展:三位電磁閥與數字閥
1.5X1.5米10噸緩沖秤的工藝細節展示
波黑共和國專線快遞(波黑快遞)
北京有哪些物流公司是騙子公司,北京有正規物流公司嗎
自動車轍試驗儀(北國盛科)
亞馬遜review是什么意思(挖掘評論并加以分析)
如何注冊網址(創建自己的網址方法)
ARENA是哪個國家的港口
德國海運費格扎克港口介紹
木箱包裝是否適用于特殊溫度環境,如高溫或低溫?
美國海運拼箱的注意事項
上銀直線導軌在使用中的注意事項
澳洲站fba(澳洲站fba重量限制)
美國餐具海運怎么操作安全(國際海運件安全嗎)
鐵路隔離柵網
大型電解法次氯酸鈉發生器的工作原理是怎樣的嗎?
為什么香港發貨沒清關
便攜干體爐在工業生產中的應用
DP/CSDX手套箱
空運時需要有哪些程序(流程)?