เราใช้คุ๊กกี้บนเว็บไซต์ของเรา กรุณาอ่านและยอมรับ นโยบายความเป็นส่วนตัว เพื่อใช้บริการเว็บไซต์ ไม่ยอมรับ
From Cern(เจิ้น) to CernYanisa Sunthornyotin
Day45: ยูนิคอร์นทำงานเลือดตาแทบกระเด็น
  • 17 กรกฏาคม

    วันนี้ตื่นเช้ารับวันใหม่มาด้วยคอร์นเฟล็ก1ชาม ครัวซองและแฮมค่ะ
    ในขณะที่คนอื่นตื่นสายและกินข้าวเช้ากันไม่ทัน มิ่งก็ได้จัดใหญ่จัดหนักไปกับมื้อเช้าแทบทุกวันโดยการตื่นมาทำอาหารตั้งแต่6โมงเช้า (รถออก8:30ก็ยังจะรีบตื่น5555)

    ได้โอกาสหุงข้าว ทอดไข่เจียว กับเตรียมผัดกะเพราแพ็คใส่ข้าวกล่องไปกินเป็นมื้อกลางวันอีก

    วันนี้เรามาต่อสู้กับความScope creepกันต่อ(ออกจะเรียกว่าScope shiftedมากกว่า เพราะถึงขนาดเปลี่ยนproject purposalกันเลยทีเดียว) แต่ก็เรียกได้ว่าส่วนที่implementเพิ่มขึ้นมาจากFlowเดิมมีไม่มากนะคะ ตัวData flowของเราทำไว้ดีอยู่แล้ว แค่เพียงเพิ่มตัวParameterที่จะconsumeจากKafka(Message queue)ขึ้นมา 

    ตัวที่เพิ่มขึ้นมาก็จะมี ชื่อ User กับ API (Application programming interface) ส่วนSystemก็คงไว้อย่างเดิม ทำการGroupใหม่เล็กน้อย คราวนี้ต้องคำนึงถึงความหมายและเหตุผลในการจับกลุ่มนับกันมากขึ้น เพราะการที่userเรียกapiที่ส่งไปยังsystemนึง ก็หมายถึงการขอRequestไปที่ระบบนั้นนั่นเอง

    ตอนแรกที่มิ่งไม่เข้าใจใช่มั้ยล่ะคะ ว่าทำไมMLถึงต้องเอามาใช้ในTaskธรรมดาๆแบบนี้ นั้นก็เพราะว่าเรามีข้อมูลทั้ง % difference ของจำนวนuser loadที่  ของจำนวนการเรียกapi และ ของจำนวนการเข้าถึงsystemที่แปรผันไป ทั้งยังมีชื่ออันไม่ซ้ำกันของแต่ละระบบ กับวันที่อีก 

    เราจะให้ความสำคัญกับการเรียกระบบช่วงวันหยุดยังไง? เทียบกับวันธรรมดาล่ะ?  ช่วงเวลากลางวันกลางคืน หรือbehaviourของuserนั้นๆ

    ถ้าหากว่าเรามานั่งgroup นั่งanalyzeทีละคนมันก็ต้องใช้พลังเยอะใช่มั้ยล่ะคะ ถึงจะเขียนโค้ดรวบเอาได้ แต่ก็ยังถือว่าเยอะอยู่ดี ยิ่งเมื่อต้องมีการเก็บข้อมูลของbehaviourเก่าๆของuserด้วยแล้ว

    ดังนั้น สู้เรารวบเอาปัจจัยหลายปัจจัยพวกนี้มารวมกันแล้วส่งไปให้ML Modelมันจำแนกให้ดีกว่า ว่าถ้าเป็นCombinationแบบนี้ มีค่า%นั้นนี่เท่านี้ จะจัดอยู่ในกลุ่มเดียวกับพวกที่เกิดตามปกติ ตามสถานการณ์ทั่วไปหรือไม่

    นั่นแหละค่ะ เหตุผล ที่เราต้องเอาMachine learningเข้ามาช่วย และการใช้Mathเพียงอย่างเดียวอาจจะไม่เพียงพอเพราะมันเกินกำลังของมนุษย์เกินไปที่จะมานั่งคำนวนหาความสัมพันธ์ของตัวเลขในแต่ละปัจจัย ซึ่งตัวที่เราจะเลือกใช้กันก็คือ Unsupervised Learning ที่ใช้ Clustering ข้อมูล เรียกว่า "KMeans" ค่ะ

    หลังจากนั่งทำงานเพลินๆไปทั้งวัน พอกลับมาที่ห้องนอนก็พบว่ามีเส้นเลือดฝอยแตกในตาค่ะ!!! 
    ตามันก็จะแดงๆหน่อย555
    นี่สินะคำนิยามของประโยคที่ว่า "ทำงานเลือดตาแทบกระเด็น"

    แต่ไม่เป็นไรค่ะ เป็นงานที่ชอบทำ ...เรียกว่าทำแล้วมันสนุก มันเพลินดี ก็แล้วกันค่ะ
    เพลินไปหน่อยจนลืมดูแลสายตาตัวเอง ก็เลยตั้งใจว่าจะพยายามนั่งให้ห่างๆจอ ปรับบุคคลิกเวลานั่งทำงานกันหน่อย เพราะปกติจะเป็นคนชอบเพ่งหน้าจอโดยไม่รู้ตัว หลังก็งอ ตาก็เพ่ง เป็นแบบนี้ต่อไปท่าจะไม่ไหว คงได้เป็นOffice syndromeกันพอดี(ถึงจะเข้าofficeไม่บ่อยก็เถอะนะ555)

    เลยหยิบทั้งแว่นตาตัดแสงสีฟ้าที่พกมา(ที่แต่ก่อนขี้เกียจหยิบ)มาใส่ แล้วก็จะไม่นั่งทำงานติดต่อกันนานๆแล้วค่ะ แบบว่า เงยหน้ามองดูนู้นนี่นั่นบ้าง เดินไปเดินมาบ้าง 
    จะพยายามปรับให้เป็นRoutineนี้ตั้งแต่วันนี้เป็นต้นไปค่ะ


เข้าสู่ระบบเพื่อแสดงความคิดเห็น

Log in