ดีแทค (dtac) จับมือ พาทเนอร์ ชวนจังหวัดต่าง ๆ บรูณาการ “ข้อมูล” (Data) สู่ Tapping the Untapped และโมเดล Co-Lab…
dtac จับมือ พาทเนอร์ ชวนบรูณาการ “ข้อมูล” (Data) สู่ Tapping the Untapped และโมเดล Co–Lab
“โครงการฯ นี้เกิดขึ้นมาจากความเชื่อในพลังของ ดาต้า ที่ผ่านมา เราเห็นยูสเคสจากใช้ประโยชน์จากดาต้าเชิงพาณิชย์อย่างแพร่หลาย แต่จะดีกว่าไหม ถ้าเราสามารถดึงผู้เชี่ยวชาญในสาขาต่างๆ มาจับมือกันเพื่อแก้ไขปัญหาสังคม
โครงการฯ นี้จึงเกิดขึ้นจากการนั่งคุยเพียง 1 ชั่วโมงระหว่างดีแทค อ.อั๋น (ผศ.ดร.ณัฐพงศ์ พันธ์น้อย) จากคณะสถาปัตย์ จุฬา และคุณโจ้ (ธิติพงษ์ เหลืองอรุณเลิศ ซีอีโอของบุญมีแล็บ)”

อรอุมา ฤกษ์พัฒนาพิพัฒน์ ผู้อำนวยอาวุโส สายงานสื่อสารองค์กร และความยั่งยืน ของ ดีแทค กล่าวว่า โครงการศึกษารูปแบบการเคลื่อนที่ และการกระจุกตัวของนักท่องเที่ยวไทยในสถานการณ์การแพร่ระบาดของโรคโควิด-19 ผ่านข้อมูลการเคลื่อนที่ (mobility data)
ซึ่งอุตสาหกรรมโทรคมนาคมถือเป็น enabler ที่สำคัญ เพราะเป็นหนึ่งในไม่กี่อุตสาหกรรมที่มีฐานข้อมูลลูกค้าอยู่ในความดูแลขนาดมหาศาล จากเดิมที่มีการพูดคุยกันในการทำวิจัยในระดับจังหวัด แต่เมื่อขยายผลให้เห็นถึงศักยภาพของ Mobility data ผู้เกี่ยวข้องทั้ง 3 ฝ่าย จึงได้เห็นชอบในการวิจัยระดับประเทศ
ข้อมูลมหาศาลนับหมื่นล้านชุด
ทว่ากว่าโปรเจกต์นี้จะเกิดขึ้นไม่ใช่เรื่องง่าย และกินเวลาทั้งสิ้นเกือบ 2 ปี โดยขั้นตอนที่ใช้เวลายาวนานที่สุดคือ การพิจารณาความเสี่ยงจากการใช้ประโยชน์ของข้อมูลเพื่อการวิจัยจากผู้มีส่วนเกี่ยวข้องที่กินเวลาราว 1 ปีครึ่ง โดยประกอบด้วยขั้นตอนการสอบทานธุรกิจ (Business Partner Due Diligence) ลงนามเห็นชอบ
ในสัญญารักษาความลับ (Non-disclosure agreement) หนังสือบันทึกข้อตกลงระหว่างองค์กร (MoU) และสัญญาการเก็บ ใช้และประมวลผลข้อมูล (Data Processing Agreement)
นอกจากนี้ ยังต้องผ่านการประเมินผลกระทบด้านการคุ้มครองข้อมูลส่วนบุคคลจากคณะกรรมการภายใน (Dara Privacy Risks & Impact Assessment) อีกด้วย เนื่องจากจัดเป็นประเด็นอ่อนไหว เกี่ยวข้องกับความเป็นส่วนตัวของลูกค้า

อย่างไรก็ตาม ด้วยความเชื่ออันแรงกล้าของทีมงาน ทุกฝ่ายได้ฝ่าฟันอุปสรรคนานัปการ โดยปฏิบัติตามเงื่อนไขที่ว่า ข้อมูลจะเป็นแบบไม่เฉพาะเจาะจง และถูกทำให้ไม่สามารถระบุตัวตนได้ (Aggregate and anonymized data) ชุดข้อมูลที่ทำการวิจัยเป็นชุดข้อมูลที่ได้รับความยินยอมจากลูกค้าแล้วเท่านั้น
ที่สำคัญ การวิเคราะห์ข้อมูลจะต้องดำเนินการในสถานที่แบบปิด ไม่สามารถเข้าถึงอินเทอร์เน็ตได้ โดยดีแทคได้อำนวยความสะดวกด้านสถานที่ไว้ที่ชั้น 31 ที่ ดีแทค เฮาส์

ด้าน วรวิมล ศรีนุต ผู้อำนวยการฝ่ายบริหารคุณค่าลูกค้า ของ ดีแทค กล่าวว่า ข้อมูลที่ถูกนำไปวิเคราะห์นี้ หรือที่เรียกว่า Mobility data สามารถระบุช่วงเวลาการใช้งาน รูปแบบการใช้งาน รวมถึงตำแหน่งของการใช้งาน ซึ่งก่อนจะนำไปวิเคราะห์ ดีแทคได้ทำให้ข้อมูลไม่สามารถระบุตัวตน
ผ่านเทคนิค Data anonymization (One-way Hashing with SHA-256) ทำให้ข้อมูลระหว่างเดือนมิถุนายน 2563 ถึงตุลาคม 2564 ที่มีขนาดนับ “หมื่นล้านชุด“ ถูกจัดทำให้อยู่ในระดับ “ตำบล“
เมื่อทำการนิรนามข้อมูล และสุ่มกลุ่มตัวอย่างให้อยู่ปริมาณที่สามารถดำเนินการวิเคราะห์ได้อย่างมีประสิทธิภาพแล้ว จึงนำข้อมูลส่งต่อนักวิจัยผ่านโครงข่ายส่วนตัว (Private network) เพื่อนำไปวิเคราะห์ต่อไป
ความท้าทายในการจัดการข้อมูลขนาดใหญ่

ผศ.ดร.ภูริพันธุ์ รุจิขจร ผู้ร่วมก่อตั้ง และ รพี สุวีรานนท์ CTO ของ Boonmee Lab เล่าว่า หลังจากได้ข้อมูลมาแล้ว ทาง อ.อั๋น ของคณะสถาปัตย์ฯ จุฬา จะทำหน้าที่เป็น Domain expert หรือผู้เชี่ยวชาญในสาขานั้นๆ
โดยจะเป็นผู้ตั้งชุดคำถาม และแนวทางการวิเคราะห์ข้อมูลขึ้นมาก่อน จากนั้นทาง Boonmee Lab จึงพิจารณาถึงการจัดการข้อมูล และหาความเป็นไปได้ในการตอบคำถามเหล่านั้น ด้วยลักษณะเฉพาะของ Mobility data ที่แสดงถึงปริมาณการกระจุกตัวของการเดินทางแต่ละรูปแบบในแต่ละพื้นที่ และในแต่ละช่วงเวลา
ทำให้ข้อมูลที่ได้รับมาจากดีแทคมีความลื่นไหลในตัวเองสูง สามารถสร้างวิธีการจัดการข้อมูลได้หลากหลายรูปแบบ นั่นจึงทำให้ทีม Boonmee Lab และ อ.อั๋น ต้องทำงานร่วมกันอย่างใกล้ชิดเพื่อร่วมกันกำหนดนิยามจากการทบทวนวรรณกรรม ขั้นตอนการวิเคราะห์ การกำหนดดัชนีชี้วัด และการตีความผลการวิเคราะห์
เพื่อให้สามารถตอบคำถามที่ต้องการได้ ตัวอย่างเช่น นิยามของการเดินทางท่องเที่ยวจากข้อมูลชุดนี้ คือ การเดินทางออกจากจังหวัดที่เป็นถิ่นที่อยู่ และสถานที่ทำงานไปสู่จังหวัดอื่นในวันหยุด เราจึงต้องมากำหนดเงื่อนไขในเชิงพื้นที่และเวลาเพื่อคัดเลือกเฉพาะข้อมูลการเดินทาง (ทริป) ที่ตรงกับนิยามการเดินทางท่องเที่ยว
เพื่อให้มั่นใจว่าข้อมูลที่ใช้นั้นสะท้อนให้เห็นถึงการกระจุกตัวของการเดินทางท่องเที่ยวในพื้นที่นั้นจริง ๆ ประกอบกับการวิเคราะห์ข้อมูลการกระจุกตัวเรากำหนดรายละเอียดลงไปถึงการกระจุกตัวของการเดินทางในระดับตำบล ซึ่งทำให้ทีม Boonmee Lab ต้องคิดหาวิธีการวิเคราะห์ข้อมูลขนาดใหญ่ที่มีประสิทธิภาพมากที่สุด
การวิเคราะห์ในครั้งนี้มีระเบียบวิธีที่ต่างออกไปจากการใช้วิธีสำรวจการเดินทางของนักท่องเที่ยวโดยแบบสอบถามและการสัมภาษณ์ซึ่งเป็นการรวบรวมข้อมูลย้อนหลังโดยอาศัยข้อมูลจากความทรงจำของนักท่องเที่ยว เนื่องจากเป็นการวิเคราะห์ Mobility data จะสะท้อนรูปแบบ และพฤติกรรมการเดินทางที่เกิดขึ้นจริงในแต่ละพื้นที่
นอกจากนั้น การวิเคราะห์ข้อมูลจึงสามารถดำเนินการได้หลากหลายรูปแบบจากลักษณะของคำถามที่ต้องการรู้และรูปแบบข้อมูลที่มีอยู่
“ในการทำงาน ทีม Boonmee Lab จะต้องวางแผนการทำงานที่มีความยืดหยุ่น เพื่อสามารถปรับเปลี่ยนวิธีการวิเคราะห์ข้อมูลให้เป็นไปตามนิยาม คำถาม และตัวแปรต่าง ๆ ได้อย่างเหมาะสม รวดเร็ว และถูกต้อง” ระพี กล่าว

ด้าน ผศ.ดร.ภูริพันธุ์ อธิบายเสริมว่า ในการจัดการข้อมูลเพื่อใช้ในการวิเคราะห์นั้น ทาง Boonmee Lab จะไม่รู้ข้อมูลส่วนบุคคลของผู้ใช้งานเลย จะรับรู้เพียงแค่ข้อมูลการเดินทางที่จะแสดงจุดเริ่มต้น และจุดปลายทางของแต่ละชุดข้อมูลเท่านั้น ทั้งนี้ ข้อมูลที่ได้รับจากดีแทคเกิดจากการ “สุ่ม“ กลุ่มตัวอย่างคิดเป็นสัดส่วนร้อยละ 10
ของบัญชีหมายเลขโทรศัพท์มือถือในเครือข่ายของดีแทคที่อนุญาตให้สามารถใช้ในการวิเคราะห์ข้อมูลได้ และเป็นบัญชีหมายเลขที่มีรูปแบบการเดินทางตรงตามนิยามการท่องเที่ยวที่กำหนดไว้ ซึ่งนับได้ว่าข้อมูลที่นำมาใช้ในโครงการมีจำนวนมากเพียงพอที่จะเป็น “กลุ่มตัวแทน“ ของการเดินทางท่องเที่ยวตามหลักสถิติได้เป็นอย่างดี
Mobility data เป็นข้อมูลแบบ Hierarchy กล่าวคือ เป็นข้อมูลที่มีลำดับชั้น และสามารถวิเคราะห์ได้หลากหลายรูปแบบ โดยมีตัวแปรสำคัญเป็นเรื่องของสถานที่และเวลา ในเชิงสถานที่สามารถประมวลผลข้อมูลได้ทั้งในระดับภาค ระดับจังหวัด จนถึงระดับตำบล
ขณะที่มิติด้านเวลาสามารถแบ่งข้อมูลออกเป็นช่วงเวลากลางวัน และกลางคืน หรือช่วงเช้า บ่าย เย็น และค่ำในแต่ละวันก็ได้ Mobility data มีความแตกต่างจากข้อมูลที่เคยผ่านมือของ Boonmee Lab มาในอดีต ทั้งในแง่ปริมาณของข้อมูลที่มีขนาดใหญ่มาก รวมถึงการเป็นข้อมูลที่บันทึกสถานการณ์จริงโดยอัตโนมัติ
ทั้งนี้ Mobility data นับเป็นข้อมูลที่มีความแม่นยำ สามารถจัดเก็บได้บ่อย และช่วยให้เข้าใจถึงรูปแบบการเดินทางได้เป็นอย่างดี ทีม Boonmee Lab จึงนำ Mobility data มาจัดการให้อยู่ในรูปแบบที่ทีมนักวิจัย
จากคณะสถาปัตยกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัยสามารถนำไปใช้วิเคราะห์ในเชิงพื้นที่ต่อได้ง่าย โดยจัดทำตารางแสดงข้อมูลที่บ่งชี้ถึงปริมาณการกระจุกตัวของการเดินทางแต่ละรูปแบบในแต่ละพื้นที่ตามช่วงเวลา
“แม้การจัดการ Mobility data จะมีความซับซ้อนสูง แต่ทีมงานรู้สึกสนุกไปกับขั้นตอนการดำเนินการอย่างมาก เนื่องจากข้อมูลชุดนี้ช่วยให้เรามองเห็นรูปแบบของการเดินทางท่องเที่ยวในแต่ละพื้นที่ ซึ่งข้อมูลสะท้อนความหมายที่แตกต่างกันเมื่อเราเปลี่ยนแปลงตัวแปรในการวิเคราะห์ข้อมูล ไม่ว่าจะเป็นเวลา สถานที่ หรือรูปแบบการเดินทาง” ระพี กล่าวเสริม

ศักยภาพที่ซ่อนอยู่ของ Mobility data
ด้าน ผศ.ดร.ณัฐพงศ์ พันธ์น้อย อาจารย์ประจำภาควิชาการวางแผนภาค และเมือง และดำรงตำแหน่งเป็นรองผู้อำนวยการหน่วยปฏิบัติการวิจัยด้านการออกแบบเพื่อพัฒนาเศรษฐกิจสร้างสรรค์ (DCE) คณะสถาปัตยกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย กล่าวว่า ทีมนักวิจัยจาก DCE ต้องทำการบ้านอย่างหนัก
และต้องประสานงานร่วมกับ ทีม Boonmee Lab อย่างใกล้ชิดเพื่อทำความเข้าใจลักษณะของข้อมูลและพิจารณาความเป็นไปได้ในการวิเคราะห์ค้นหาคำตอบภายใต้มาตรการการคุ้มครองข้อมูลส่วนบุคคล ในช่วงแรกทีมนักวิจัยได้จัดทำชุดคำถามที่น่าจะเป็นประโยชน์ต่อการพัฒนาการท่องเที่ยว และสามารถวิเคราะห์ได้จากข้อมูล Mobility data
จากนั้นจึงนำข้อมูลที่ได้รับจาก ทีม Boonmee Lab มาวิเคราะห์ต่อ โดย ระบบภูมิสารสนเทศภูมิศาสตร์ (Geographic Information System; GIS) เพื่อทำให้เห็นข้อมูลการกระจุกตัวของการเดินทางท่องเที่ยวในเชิงพื้นที่อย่างชัดเจนมากยิ่งขึ้น
ขั้นตอนนี้เรียกว่า scanning เพื่อคัดกรองว่าข้อมูลที่มีอยู่ทำให้เราเข้าใจสถานการณ์การท่องเที่ยวในประเด็นได้บ้าง เมื่อวิเคราะห์ข้อมูลจนได้ผลที่ชัดเจนในแต่ละมิติทั้งในด้านรูปแบบการเดินทาง และปริมาณการกระจุกตัวในแต่ละสถานที่และช่วงเวลาแล้ว
ทีมนักวิจัยจากจุฬาลงกรณ์มหาวิทยาลัยจึงนำผลการวิเคราะห์มาพิจารณาค้นหาความหมาย (connect the dots) เพื่อพิจารณาถึงแนวทางการพัฒนาการท่องเที่ยวที่เหมาะสมกับในแต่ละพื้นที่

“ประเด็นสำคัญของการทำงานในขั้นตอนนี้ คือ ผู้วิจัยจะต้องเข้าใจทั้งลักษณะของ Mobility data และแนวทางการนำข้อมูลไปใช้ประโยชน์ จึงจะสามารถวางกรอบการวิเคราะห์ที่ชี้ให้เห็นศักยภาพ และข้อจำกัดของการพัฒนาการท่องเที่ยวในแต่ละพื้นที่ได้อย่างชัดเจน”




























