投資者情緒對股票市場回報率的影響探討
本文是一篇投資分析論文,通過挖掘分析微博平臺中投資者情緒的變化發現,在疫情這個大環境背景下,網絡社交媒體中的網絡輿情會對股市產生影響,因此從網絡輿情的角度對投資者、網絡社交平臺提出相關建議。
1相關理論與方法基礎
1.1行為金融學理論
傳統金融學理論認為,金融市場上的投資者均為理性人,金融市場是一個有效的市場。由于投資者是理性的,金融市場資產價格并不會隨著投資者情緒產生波動。但隨著時間推移,金融市場上出現許多有效市場假說無法解釋的異象。傳統金融學理論認為的觀點與如今的實際數據出現偏差。基于這些偏差,學者們開始質疑傳統金融學理論的適用性,行為金融學理論逐漸產生。
行為金融學理論將人類心理活動如何對金融市場產生影響納入研究范圍[41]。隨著行為金融學理論的迅速發展,對傳統金融學理論造成了很大的沖擊。行為金融學博采眾長,涉及心理學,社會學等領域、人類學及其他有關概念,從行為產生的內在心理活動進化開始,探討了投資者投資決策在金融市場中的作用。行為金融學理論具有許多代表性學說,例如認知偏差理論。認知偏差理論指出,當一個人面對投資決策時,根據自己的經驗法則來評判,這一行為易導致決策失誤。行為金融學包括許多經典理論,這些理論為后續投資者情緒對金融市場影響的相關研究奠定了扎實的理論基礎。
..................
1.2文本挖掘技術
在網絡信息時代,用戶可通過網絡獲取各種不同形式,不同門類的數據,包括技術資料,娛樂資訊。組成一個異常巨大的數據庫。對大量數據進行采集和加工,傳統信息檢索技術的加工方法已不能令人滿意,而文本挖掘技術可以有效解決這一問題[42]。文本挖掘作為數據挖掘中的重要分支之一,它是從數據挖掘演變而來。它可以將網絡中獲取的文本內容轉化為可被利用的信息,但它不僅僅是將數據挖掘技術簡單地挪用到文本上,還需要做很多準備與處理工作。
1.2.1文本挖掘過程介紹
文本挖掘是一個從非結構化到結構化的過程,是多方技術的綜合。總體來看,文本挖掘是將非結構化的原始文本信息進行一系列處理,變成結構化數據從而進行知識發現。根據文本挖掘工作的流程,將其過程分為以下幾個部分:
(1)文本獲取:網絡文本一般以網頁的形式出現,需要利用爬蟲技術對網頁進行抓取并形成文本數據庫。
(2)文本預處理;對文本信息進行篩選,去除網頁中的不必要信息。
(3)分詞:詞是最小的情感單元,分詞即將連續的句子按照規則切分成詞語,對于中文分詞,國內已有許多開源的分詞工具。
(4)去停用詞:將一些如標點符號等沒有研究意義的停用詞去除,有利于更高效地處理數據。
(5)特征選擇:從原始特征中篩選出有效特征從而對數據集進行降維的過程。
(6)文本挖掘:完成上述步驟后,文本數據轉化為矩陣,根據需要選擇算法對文本進行挖掘。
....................
2投資者情緒指數的構建
2.1文本信息獲取來源及采集方法
2.1.1文本信息獲取來源
互聯網如今作為重要的信息獲取來源,迎來了大量的使用者。根據CNNIC發布的第49次《中國互聯網絡發展狀況統計報告》顯示,截至2021年12月,互聯網使用者的數目已經達到10.32億,互聯網普及率達到73.0%[43]。隨著網民規模的穩步增長,更多的人會主動地在社交媒體平臺發表自己的意見看法,表達自己對各類事件的情緒,互聯網成為情緒信息獲取的重要平臺。本文也選擇互聯網中社交媒體作為構造投資者情緒所需的文本數據來源,對比各種社交媒體,本文最終選擇微博作為信息獲取來源。微博在社會分發速度、影響力、傳播速度等方面都優于其他社交媒體。也是現在年輕人進行資源共享及信息交流的首選工具。由于本文研究發生于新冠疫情背景下,對于新冠疫情這種影響廣泛的突發公共衛生事件,人們更愿意在微博這種面向大眾的平臺上表達自己的觀點與看法,因此微博更能及時地反映情緒的變化。綜上,本文選擇微博作為文本信息的獲取來源。
2.1.2文本信息的爬取方法
由于微博數據復雜且存在各種限制,無法通過普適性方法對所需全部信息進行抓取,因此,本文采用爬蟲技術,根據本文所需數據自行編寫程序,來實現文本自動化抓取。爬蟲是指模擬瀏覽器通過一些程序對網絡信息自動抓取的過程。爬蟲的基本流程如圖2-1:
投資分析論文參考
...............................
2.2文本數據的預處理
經過爬蟲技術獲取微博原始文本后,需要經過清洗、分詞、去除停用詞等預處理工作,才能轉化成可以被識別的格式,進而開展后續的分類和情感分析工作。文本數據預處理包括數據清洗。分詞及去除停用詞。
2.2.1文本數據清洗
爬取的微博數據常常都帶有一些無關字符和網頁鏈接的標簽等,還有一些語句中夾雜的符號,如“【】”“#”等,這些對文本的情緒分析無關,可能會影響情緒分析的準確性。因此,在進行文本分析前,要對這些無關信息進行數據清洗。
2.2.2文本分詞
由于中文語句一般沒有空格符間隔,因此需要將語句進行切分割,將每條語句的詞語分開,轉化為一個個有語義特征的詞語,進而轉化為一定長度的數值型特征向量進行后續的情緒分析及相關計算。分詞是分類過程的一個基本環節,文中選用的分詞方法是在Python環境中使用jieba分詞程序包實現中文文本數據分詞。把它加工為具有語義特征的一定長度的詞。
jieba是一款被廣泛使用的高性能及高準確率的中文開源分詞包。且提供如Python、C++等多種編程語言支持,使用非常方便。它是基于規則和統計兩種方法建立的。jieba分詞支持四種分詞模式,即精確模式、全模式、搜索引擎模式和Paddle模式,本文主要調用了分詞模式中的精確模式,這個模式能最準確地分離句子,適合文本分析。同時,jieba分詞支持用戶添加自定義詞典,以便包含jieba里沒有的詞匯。在分詞過程中發現,jieba分詞庫的詞匯不完全包含疫情相關固定詞匯,會容易導致這些詞匯被錯誤地拆分,通過對分詞后的結果進行歸納整理,形成了疫情自定義詞典,將其加入到jieba自定義分詞庫中重新進行分詞。例如,沒有添加自定義詞典前,jieba原始分詞庫將“無癥狀感染者”分成“無癥狀”和“感染者”兩個詞語,所以為了保證分詞的嚴謹性,將這些疫情固定詞匯加入再進行分詞,以達到更為精準的效果。
......................
3投資者情緒對股票市場回報率影響的實證分析......................23
3.1樣本選取................................23
3.2變量說明....................................23
4投資者情緒對股票回報率影響的行業差異分析....................33
4.1樣本選取......................................33
4.1.1醫藥行業樣本選取................................33
4.1.2旅游行業樣本選取............................33
5研究結論與政策建議...............................47
5.1研究結論........................................47
5.2相關政策建議............................48
4投資者情緒對股票回報率影響的行業差異分析
4.1樣本選取
4.1.1醫藥行業樣本選取
在新冠疫情的強烈沖擊下,國內大部分行業都停滯不前。相對于其他行業而言,醫藥行業自身的韌性很強,遇到疫情沖擊時自我調節能力較強。從股價的角度來看,疫情期間醫藥衛生行業發展迅猛,醫藥行業股票價格呈上漲趨勢,市場對于醫藥行業股票回報率的確定性,使醫藥股備受投資者的青睞。
本文選擇上證醫藥主題指數(000121)作為衡量醫藥行業的代表指數。上證醫藥主題指數是從上證綜指中以規模大小為標準,選擇歸屬于醫藥衛生行業的50只主題股票組成的指數,是上交證券所上市的大、中市值且日成交金額為前50支的股票組合。這一指數具有較高的相關性和準確性,能較好地反映醫藥股的整體市場波動,因此該指數被選為反映醫藥股整體表現的代表性指數。
4.1.2旅游行業樣本選取
以人員的空間移動為主的旅游業,對于疫情這類重大突發公共事件具有高敏感性。由于旅游活動本身具有時空特點,因此旅游業的恢復要比其他行業慢很多,損失和影響也是即刻顯現的。與此同時,因為疫情爆發是在春節來臨之際,許多居民的出游計劃被迫取消,大多旅游企業經營舉步維艱,投資者對于疫情的悲觀情緒使得收益率下降。本文選擇中證旅游指數(930633)作為旅游行業的代表指數。
投資分析論文怎么寫
.......................
5研究結論與政策建議
5.1研究結論
在新冠疫情背景下,股票市場發生嚴重震蕩,通過研究新冠疫情引起的投資者恐慌情緒對股票市場的影響,有助于投資者做出合理投資決策。本文選取2020年1月9日到2021年12月31日作為研究區間,選擇微博作為反映投資者對疫情產生情緒變化的文本信息來源,利用網絡爬蟲技術完成了新冠疫情相關微博內容的收集工作,并對收集到的文本進行分詞等預處理工作后,利用隨機森林算法對全部文本進行分類,分別構建了疫情爆發期和疫情常態期的投資者情緒指數,并構建VAR模型與對應時間段的A股市場回報率進行實證研究,分析疫情不同時期投資者情緒與A股市場回報率二者的關系,同時選取受疫情影響較大的3個行業,分別是醫藥、旅游、交通運輸。利用VAR模型,研究疫情不同時期投資者情緒對不同行業的影響差異。本文主要得出以下結論:
一、投資者情緒與A股市場回報率存在單向格蘭杰因果關系,且該種關系僅在疫情爆發期存在。在疫情爆發期,投資者情緒是股票市場回報率的格蘭杰原因、因為在疫情初爆發的時期,投資者面對突發疫情無法快速做出決策,較為依賴社交平臺上其他投資者態度影響,當發布內容多為對疫情及市場利害信息后,投資者投資的意愿減少,導致回報率降低;但在疫情常態期,投資者情緒不是市場回報率格蘭杰原因,因為在此時期,投資者面對常態化疫情已經可以自主分析市場變化趨勢,對社交平臺發表言論及態度的參考性減少。
二、投資者情緒變化會引起A股市場回報率的變化,但在疫情不同時期的股票回報率對投資者情緒的反應程度有所不同。從脈沖響應和方差分解結果來看,在疫情爆發期,投資者情緒的變動會導致A股市場回報率產生同向變動,投資者情緒增加會導致A股市場回報率增加,影響可持續7-8期,解釋力度可達到24.45%左右,疫情爆發期投資者情緒對股票市場回報率影響不容忽視。在疫情常態期,投資者情緒的變化對A股市場回報率的影響作用十分微弱,解釋力度僅為0.65%,隨著疫情發展進入中長期,市場恐慌情緒逐漸穩定,疫情進入常態化,帶給股市的邊際效益減弱,說明疫情對A股市場產生的邊際震蕩效應逐漸減弱。
參考文獻(略)
- 農業綜合開發項目投資分析——以當涂縣江心洲國際...2023-10-30
- 企業數字化能提高對外直接投資速度嗎?2024-01-02
- 公司創業投資對被投資企業技術創新績效的作用機制...2024-02-08
- 累積前景理論下投資組合問題的分析和求解2024-03-11