เราใช้คุ๊กกี้บนเว็บไซต์ของเรา กรุณาอ่านและยอมรับ นโยบายความเป็นส่วนตัว เพื่อใช้บริการเว็บไซต์ ไม่ยอมรับ
The ListTeepagorn W.
On Trump & Data Analysis
  • อันนี้สุดยอดมาก

    เป็นการวิเคราะห์ทวีตของโดนัลด์ ทรัมป์ ที่มีคนไปสังเกตมาจนรู้ว่าทรัมป์มีทวีตสองบุคลิก คือถ้าเป็นแบบ "ออกสื่อ" จะเป็นไอโฟน และถ้าเป็นแบบ "โกรธเกรี้ยว" จะเป็นแอนดรอยด์ ก็คาดการณ์กันว่า ทรัมป์ตัวจริงคงใช้แอนดรอยด์ ส่วน PR คงใช้ไอโฟน

    เช่น ทรัมป์ทวีตอวยพรนักกีฬาโอลิมปิกจากไอโฟน และทวีตด่าคู่แข่งจากแอนดรอยด์

    Data Analyst คนนี้ก็เลยไปขุดทวีตทั้งหลายของทรัมป์มาทำสถิติ (เข้าใจว่าใช้ภาษา R มาจัดข้อมูล) ได้ข้อสรุปน่าสนใจหลายอย่าง เช่น ทวีตที่มาจากไอโฟนจะมีภาพหรือลิงก์แนบมาด้วยมากกว่าแอนดรอยด์ 38 เท่า จะใช้แฮชแท็กมากกว่า และมีแนวโน้มที่จะเป็น "นัดหมาย" (เช่น บอกว่า พรุ่งนี้เจอกันสองทุ่มที่รายการ...) ส่วนแอนดรอยด์จะใช้ถ้อยคำที่สื่อถึงอารมณ์มากกว่าเช่น badly crazy weak (ดูกราฟ)

    ยัง ยังไม่พอ เขาเอาข้อมูลอารมณ์ไปจัดเข้าอารมณ์ 10 แบบด้วย คือ positive, negative, anger, anticipation, disgust, feat, joy, sadness, surprise และ trust ก็พบว่าตัวจริงจะทวีตที่รู้สึก sadness, fear, anger, disgust เยอะ และจะไม่ค่อยทวีตอารมณ์ trust, joy

    นี่เป็นการใช้ Data Analysis ที่น่าสนใจมากๆ ครั้งหนึ่งเลยนะ

    คนทำเป็น Data Scientist อยู่ที่ Stack Overflow
    http://varianceexplained.org/r/trump-tweets/





Views

เข้าสู่ระบบเพื่อแสดงความคิดเห็น

Log in