เราใช้คุ๊กกี้บนเว็บไซต์ของเรา กรุณาอ่านและยอมรับ นโยบายความเป็นส่วนตัว เพื่อใช้บริการเว็บไซต์ ไม่ยอมรับ
เรียนรู้เรื่องใกล้ตัวในมุมสังคมวิทยาSaGaZenJi
โลกใบใหญ่กับข้อมูลขนาดยักษ์
  •        ผมได้มีโอกาสนัดพูดคุยเพื่อนชาวญี่ปุ่นคนหนึ่งเมื่อไม่นานมานี้ก่อนช่วงเทศกาลสงกรานต์ เรานัดจิบชาคุยเรื่องสัพเพเหระต่างๆ ที่กำลังประสบกันอยู่ ส่วนใหญ่แล้วหมดไปกับเรื่องการอวด Apps อ่านหนังสือออนไลน์ซึ่งทางญี่ปุ่นสนับสนุนเรื่องนี้จริงจังมาก ร้านหนังสือที่ญี่ปุ่นหลายๆ ร้านมีบริการหนังสือแบบดิจิตัลขายคู่กับตัวเล่ม ในขณะที่ประเทศของเรานั้นหาได้น้อยเสียเหลือเกินแต่นั่นไม่ใช่สาระสำคัญของสิ่งที่ผมจะบอกเล่าเก้าสิบให้ฟังในวันนี้หรอกนะครับ เพียงแค่จุดเริ่มต้นของบทความนี้เกิดขึ้นจากบทสนทนาที่ผมได้เกริ่นไปเท่านั้นเอง

                จริงๆ แล้วประเด็นหนึ่งที่ผมฉุดคิดขึ้นมาได้เมื่อพูดถึงการซื้อการขายของออนไลน์คือ เรื่องการสมัครสมาชิกและประวัติการเข้าชมสินค้ารวมถึงสิ่งที่เราจ่ายไป สิ่งเหล่านี้ถูกบันทึกเอาไว้บนอินเตอร์เน็ตทั้งหมด ซึ่งถ้ารวมข้อมูลของทุกคนเข้าด้วยกันแล้วข้อมูลที่ว่านี้จะมีขนาดมหึมาและรกไซเบอร์สเปซมากทีเดียวแต่เป็นเรื่องที่น่าแปลกว่าข้อมูลขยุกขยุยพวกนี้กลับกลายเป็นขุมทรัพย์อันล้ำค่าสำหรับนักการตลาดและคนทำธุรกิจมาเป็นเวลามากกว่าสิบปีแล้ว..เคยแปลกใจไหมครับว่าอะไรที่นั่งค้นนั่งหาเมื่อสองสามวันก่อน อยู่ๆ ก็ตามมาเป็นคอนเทนต์โฆษณาในเฟสบุ๊กหรืออินสตราแกรมเฉยเลย ถ้าเคยสงสัยก็ยินดีด้วยครับ เพราะเราจะมาทำความเข้าใจปรากฏการณ์นี้กันเสียหน่อย

                สิ่งที่ผมพล่ามมาทั้งหมดจริงๆ ศัพท์แสงสวยหรูเขาเรียกว่า “Big Data” ครับ ซึ่งผมเข้าใจว่าหลายคนน่าเคยได้ยินคำนี้กันมาบ้าง เท่าที่สืบค้น คำนี้เพิ่งจะใช้กันราวๆ ปี 2000 เองครับ ในวงการธุรกิจและการตลาด แต่ที่น่าสนใจคือวงวิชาการเองก็เริ่มเอาคำนี้มาพูดถึงกันบ้างแล้วในช่วง 4-5 ปีที่ผ่านมา ประเด็นหนึ่งที่ชวนน่าปวดหัวคือ การกำหนดขอบเขตของสิ่งทีควรจะเรียกว่า “ข้อมูลขนาดยักษ์” นี่ล่ะครับ นักเศรษฐศาสตร์ก็ดี นักสถิติก็ดี รวมถึงพวกสายคอมก็ดี ยังคงเถียงกันไปมาถึงหลักเกณฑ์ที่จะใช้แบ่งแยกข้อมูลอื่นๆ ออกจากข้อมูลประเภทนี้ แต่โชคดีก็ยังมีอยู่บ้าง นักวิจัยด้านนี้อย่าง Rob Kitchin ได้สรุปข้อถกเถียงของบรรดานักต่างๆ ที่ผู้เขียนพูดไว้ให้เสร็จสรรพ

           ร็อบกล่าวว่า สิ่งที่จะถือว่าเป็นข้อมูลขนาดยักษ์ได้นั้นไม่ใช่มีแค่ขนาดข้อมูลที่ต้องเยอะอย่างเดียวแต่ข้อมูลที่ว่านี้ต้องได้รับการอัพเดทเกือบจะเรียลไทม์อยู่ตลอดเวลารวมถึงต้องสามารถสะท้อนภาพรวมของเจ้าของข้อมูลได้อย่างดีด้วย ตัวอย่างหนึ่งที่เห็นได้ชัดคือ ข้อมูลทางการจับจ่ายใช้สอยของเราผ่านการใช้บัตรต่างๆ นั่นล่ะครับ หลายๆ คนอาจจะสงสัยว่าแล้วยังไงต่อ? มันก็แค่ข้อมูลที่บอกว่าเราซื้ออะไร ราคาเท่าไหร่แค่นั้นไม่ใช่เหรอ? ... ใช่ครับ แต่อย่าลืมว่าของที่เราซื้อกันมันก็มีรายละเอียดอีกเยอะ เช่น สมมติเราไปซื้อของที่ซุปเปอร์ ตอนพนักงานสแกนราคาโยเกิร์ตที่เราหยิบมา ข้อมูลตั้งแต่ยี่ห้อยันไซส์ของโยเกิร์ตที่เราซื้อได้ถูกป้อนเข้าเครื่องไปพร้อมๆ กับกราโนล่าที่เราคิดว่าจะเอามากินคู่กัน พอรูดบัตรปั๊ปทีนี้ชื่อคุณ บ้านเลขที่ ที่อยู่ ก็จะถูกเอามารวมกับข้อมูลเมื่อสักครู่ด้วย แน่นอนว่าซุปเปอร์ที่คุณไปซื้อก็ถูกบันทึกด้วยเช่นกัน นักการตลาดและนักธุรกิจเอาไอ้ข้อมูลก้อนนี้ล่ะครับไปวิเคราะห์ได้ง่ายๆ เลยว่าคุณชอบโยเกิร์ตไซส์ไหน รสอะไร หรือมักซื้อคู่กับอะไรเป็นพิเศษ รวมถึงที่ที่คุณมักไปซื้อสิ่งเหล่านี้อยู่ใกล้บ้านคุณแค่ไหน พอเห็นภาพแสงยานุภาพของเจ้า “Big Data” บ้างหรือยังครับ? 

          จนถึงตรงนี้ถ้าสนใจรายละเอียดเจ้านิยามที่ไปที่มาของ Big data คลิก ลิงค์ นี้เลยครับ ผมโยงไปถึงหนังสือคนที่ผมอ้างมาไว้เรียบร้อยแล้ว น่าจะพอตอบคำถามที่ทิ้งไว้ข้างบนได้ว่า คอนเทนต์โฆษณาที่โผล่บนเฟสบุ๊คราวกับรู้ใจเรามาจากไหนกัน

                ถึงแม้ว่าเจ้าข้อมูลตัวเขืองจะโลดแล่นและใช้กันอย่างยาวนานในแวดวงธุรกิจ แต่ศักยภาพที่มาพร้อมกับขนาดตัวของมันเพิ่งจะต้องตาต้องใจนักสังคมศาสตร์เมื่อ 2-3 ปีที่ผ่านมานี้เองครับ สิ่งหนึ่งที่เจ้า Big Data มีความดีงามอยู่ก็คือ ข้อมูลที่ละเอียดของมันสามารถนำมาใช้ในการวิเคราะห์พฤติกรรมทางสังคมได้หลากหลายไม่ต่างอะไรกับการทำแบบสอบถามซึ่งเป็นเทคนิควิจัยรุ่นปู่รุ่นย่าที่อยู่คู่สายสังคมศาสตร์มาอย่างยาวนาน

          ในปัจจุบัน การตอบแบบสอบถามเป็นเรื่องที่ยากเย็นเหลือเกิน นักวิจัยไม่มากก็น้อยต้องปาดเหงื่อเสียน้ำตากับข้อมูลที่ใช้ไม่ได้เนื่องจากแบบสอบถามไม่สมบูรณ์ ถึงแม้จะมีความพยายามในการย้ายการสอบถามขึ้นไปบนโลกออนไลน์แต่ก็ไม่วายมีประเด็นเรื่องความร่วมมือ หรือการโฆษณาเชื้อเชิญให้มาทำแบบสอบถามอยู่ดี ตรงนี้เองที่เจ้าข้อมูลตัวใหญ่ของเราสามารถตอบโจทย์ในการแก้ปัญหาความยุ่งยากนี้ได้ด้วยคุณสมบัติที่อัดแน่นของสิ่งที่มันบันทึก นักสังคมศาสตร์แขนงต่าง ๆ สามารถหยิบเอาส่วนย่อย ๆ ในนั้นมาใช้ในการวิเคราะห์ได้ ในเชิงทฤษฎี ตัวเลขหรือข้อมูลเหล่านี้มีความเที่ยงตรงและสะท้อนพฤติกรรมของผู้ให้ข้อมูลได้ดีกว่าแบบสอบถามเสียด้วยซ้ำ เนื่องจากสิ่งเหล่านี้ถูกบันทึกโดยที่ผู้ตอบแบบสอบถามไม่รู้สึกตัวหรือรู้ว่าตนเองกำลังเป็นเหยื่อของการทดลองอะไรบางอย่างอยู่

          อย่างไรก็ตามการใช้ข้อมูลขนาดยักษ์ที่ว่านี้ก็ไม่ได้ง่ายดายเสียทีเดียว ปัญหาเรื่องจริยธรรมและความเป็นส่วนตัวของข้อมูลก็ถือเป็นเรื่องที่คิดกันไม่ตกว่าจะจัดการอย่างไรดี รวมถึงการนำข้อมูลนี้มาใช้ในการศึกษาทางด้านสังคมศาสตร์เองนั้น นักวิจัยจำเป็นต้องเรียนรู้ทักษะในการจัดการข้อมูลย่อยๆ จากก้อนข้อมูลใหญ่ยักษ์นี้ด้วย บางคนมองว่ามันถึงเวลาแล้วที่นักสังคมศาสตร์ต้องอัพสกิล Data science กับเขาเสียที หรือบางคนมองว่านี่แหละเป็นข้อจำกัดของการทำวิจัยดีๆ นี่เอง ซึ่งถ้าจะมาทางนี้จริงการศึกษาสังคมศาสตร์คงต้องเปลี่ยนแนวคิดกันพอตัวกับการบริหารข้อมูลที่ได้มา ส่วนตัวแล้วผมคิดว่าคงไม่สามารถใช้ข้อมูลที่ว่านี้ลำพังได้โดยไม่มีข้อมูลจากการสอบถามหรือการสัมภาษณ์มาประกอบเนื่องจากแค่ตัวข้อมูลที่ได้มาไม่มีประโยชน์อะไรเลยถ้าไม่นำไปใช้บนแนวคิดหรือกรอบการวิเคราะห์อะไรสักอย่างที่เป็นระบบ

          ปัจจุบันมีงานหลายงานทางสายสังคมที่ได้ประยุกต์ใช้ข้อมูลขนาดยักษ์นี้ในการศึกษา งานหนึ่งที่เป็นที่รู้จักกันดีคือการศึกษาของ Mihály Fazekas ในประเด็นการคอรัปชั่นซึ่งเก็บข้อมูลในประเทศที่ยังไม่มีการบันทึกเหตุการณ์ด้านนี้อย่างเป็นระบบเสียด้วยซ้ำ งานวิจัยชิ้นนี้ประยุกต์เอาข้อมูลการจับจ่ายใช้สอยและพฤติกรรมการบริโภคของคนในรัฐจากองค์กรต่างๆ ที่บันทึกข้อมูลเหล่านี้เอาไว้ (แน่นอนว่าผ่านการขอจริยธรรมและเอาเฉพาะข้อมูลที่เปิดเผยได้มาเท่านั้น) มาใช้ในการวิเคราะห์จนได้โมเดลคอรัปชั่นที่อาจจะเกิดขึ้นของประเทศที่ศึกษาเลยทีเดียว อีกงานที่น่าสนใจคืองานของ Brooker และทีมงานที่ทำการวิเคราะห์พฤติกรรมของผู้ป่วยที่ป่วยเป็นโรค cystic fibrosis ซึ่งเป็นโรคทางพันธุกรรมชนิดหนึ่งที่ร่างกายจะสร้างเสมหะในปอดจนไปทำลายปอด การวิจัยนี้เป็นงานทางด้านสังคมวิทยาการแพทย์ที่อาศัยข้อมูลขนาดยักษ์มาส่องประสบการณ์และการใช้ชีวิตของผู้ป่วยผ่านทวิตเตอร์ที่พวกเขาใช้บ่นสิ่งต่างๆ ในชีวิตประจำวันซึ่งทำให้นักวิจัยได้ข้อมูลเชิงลึกที่สะท้อนความรู้สึกนึกคิดของผู้ป่วยโดยไม่ต้องไปสัมภาษณ์แม้แต่คนเดียว นี่ก็เป็นตัวอย่างน้ำจิ้มกรุบกริบว่ามันก็เอามาใช้บ้างแล้วนะเออ

                จนถึงตรงนี้คิดว่าใครที่เข้ามาอ่านก็น่าจะพอเห็นภาพว่าการศึกษาสังคมกับข้อมูลขนาดยักษ์ไปด้วยกันได้อย่างไร แต่จริงๆ แล้วประเด็นต่างๆ ไม่ได้จบแค่นี้หรอกครับ เรื่องในเชิงมโนทัศน์ เช่น politics of big data ก็ดี หรือ How to deal with big data ก็ดี ยังมีรายละเอียดอีกเยอะ สำหรับคนที่สนใจ นอกจากหนังสือของ Rob Kitchin แล้ว ผมก็แนะนำให้ลองหาบทความของ Bright เรื่อง Big social science: doing big data in the social sciences อันนี้ก็เป็นบทความที่ดีเหมือนกันครับ

เข้าสู่ระบบเพื่อแสดงความคิดเห็น

Log in