เผยแพร่ครั้งแรกบนเว็บไซต์ http://www.thaipublica.org/
สฤณี อาชวานันทกุล
ข้อมูลถูก กราฟผิด
ตัวอย่างของการใช้กราฟที่ไม่เหมาะสมกับข้อมูลอย่างสิ้นเชิงจนท้าให้มันสื่อสารไม่ได้ คือภาพประกอบข่าวชิ้นหนึ่ง
จากเว็บไซต์หนังสือพิมพ์ เดอะ เนชั่น - The Nation ปี 2011 (ก๊อปภาพนี้เก็บไว้นาน ผู้เขียนหาลิงก์ข่าวที่
เกี่ยวข้องไม่เจอแล้ว ขออภัยผู้อ่านทุกท่าน)
เปรียบเทียบอัตรากาไรสุทธิ บริษัทอสังหาฯ ในตลาดหลักทรัพย์
ปัญหาใหญ่ของภาพนี้คือดูออกยากมากว่าต้องการจะสื่ออะไร เนื่องจากผู้จัดท้าเลือกใช้วงกลมมาน้าเสนอข้อมูล
ของแต่ละบริษัท แทนที่จะใช้กราฟแท่งหรือเส้น (สองแท่งหรือสองเส้นต่อหนึ่งบริษัท) เพื่อสร้างความชัดเจนว่า
ก้าลังเปรียบเทียบตัวแปรเดียวกันของแต่ละบริษัท เพียงแต่ต่างปีกัน
ใช้กราฟให้เป็น
จากตัวอย่างกรณี “ข้อมูลถูก กราฟผิด” ข้างต้น ลองมาลงลึกในปัญหานี้ต่อ โดยตั้งต้นจากแผนภูมิและกราฟ
พื้นฐานสามประเภท เพราะประโยชน์ของการใช้กราฟคือ ลักษณะต่างๆ ของกราฟ เช่น ความยาว ความกว้าง
ขนาดของพื้นที่ ฯลฯ สามารถสื่อสารความหมายของตัวเลขอย่างชัดเจนกว่าถ้าใช้แต่ตัวเลขโดดๆ เท่านั้น
การเลือกใช้กราฟให้เหมาะสมกับข้อมูลจึงเป็นก้าวแรกๆ ที่จ้าเป็นต่อการท้าอินโฟกราฟฟิกที่ดี
ลองมาดูตัวอย่างกันสักเล็กน้อยจากแผนภูมิและกราฟพื้นฐานสามชนิด ได้แก่ แผนภูมิวงกลม แผนภูมิแท่ง และ
กราฟเส้น
1. แผนภูมิวงกลม
2. แผนภูมิแท่ง
3. กราฟเส้น
อินโฟกราฟฟิกเน้นข้อมูลเชิงคุณภาพหลายชิ้นอัดเนื้อหาเต็มพื้นที่จนคนอ่านตาลาย ภาพประกอบและสัญลักษณ์
ต่างๆ ที่ใช้ก็ไม่ค่อยเกี่ยวกับเนื้อหา ไม่ได้สื่อประเด็นอะไรเท่ากับเอาไว้ “พักสายตา” คนอ่านมากกว่า ถ้าผู้ผลิตไป
ท้าเป็นสื่อสิ่งพิมพ์แจกอย่างเช่นแผ่นพับ หรือเขียนเป็นบทความน่าจะเหมาะสมกว่ากันมาก เพราะเหมือน “ความ
เรียง” มากกว่า “อินโฟกราฟฟิก” ที่ท้าเพื่อการสื่อสารออนไลน์เป็นหลัก
ไม่ว่าจะใช้กราฟฟิกสวยงามเพียงใดหรือมีมือดีไซน์เจ๋งขนาดไหน ข้อมูลจ้านวนมากก็ยากแก่การท้าความเข้าใจอยู่ดี
โดยเฉพาะข้อมูลเชิงปริมาณที่มีหลายหลัก (เช่น เงินหลักแสนล้านหรือล้านล้าน) และข้อมูลเชิงเปรียบเทียบ เช่น
ข้อมูลตัวเดียวกันแต่เปรียบเทียบข้ามบริษัท ข้ามอุตสาหกรรม หรือข้ามประเทศ
ความกระหายเบียร์ของเอเชียตะวันออกเฉียงใต้ (ล้านลิตร)
ที่มา: AFP
ภาพนี้บอกว่า คนเวียดนามดื่มเบียร์มากที่สุดในภูมิภาค คือ 2,595 ล้านลิตร ตามด้วยไทย 1,805 ล้านลิตร และ
ฟิลิปปินส์ 1,622.7 ล้านลิตร
การป้องกันความเข้าใจผิดนี้ท้าได้ง่ายๆ ด้วยการหาตัวเลขประชากรของแต่ละประเทศมาหารปริมาณเบียร์ที่บริโภค
ผลลัพธ์ที่ได้คือ “ปริมาณเบียร์ต่อหัว” ดังภาพนี้ –
ความกระหายเบียร์ของเอเชียตะวันออกเฉียงใต้ (ลิตรต่อหัว)
ที่มา: ผู้เขียน ดัดแปลงจากข้อมูล AFP
เชื่อมข้อมูลมาใกล้ตัว
The
Numbers, The Taxes, The History & The Value
แบบแรก The Numbers (ตัวเลข) ค้านวณว่าครอบครัวอเมริกันแต่ละครอบครัวต้องรับภาระแพ็คเกจอุ้ม
ครอบครัวละเท่าไร (ประมาณ 55,198 เหรียญสหรัฐต่อครอบครัว)
อย่าตายน้้าตื้นกับสถิติ
ในช่วงสุดท้าย ผู้เขียนอยากพูดถึง “กับดักทางสถิติ” ที่พบเห็นบ่อยแต่ไม่ค่อยมีใครฉุกคิดว่าติดกับดัก รวมทั้งตัวคน
ที่ออกแบบอินโฟกราฟฟิกเองด้วย โชคดีที่ไปเจอเว็บ School of Data ซึ่งมีชุดบทความอ่านง่ายเกี่ยวกับการท้า
ความเข้าใจและจัดการกับข้อมูล รวมถึงบทความเกี่ยวกับความเข้าใจผิดเกี่ยวกับสถิติ ผู้เขียนจึงถือวิสาสะแปลเป็น
ภาษาไทยเพื่อเผยแพร่โดยทั่วกัน
ระวัง! ความเข้าใจผิดพบบ่อยและวิธีหลีกเลี่ยง
แปลจาก Look Out! Common Misconceptions and How to Avoid Them, เว็บไซต์ School of Data
วันนี้เราจะมาดูความเข้าใจผิดและกับดักทางความคิดที่พบบ่อยเวลาที่คนเริ่มวิเคราะห์ข้อมูลเพื่อแสดงด้วยภาพ
คุณจะหลีกเลี่ยงความผิดพลาดในงานของคุณ และไม่ตกหลุมพรางในงานของคนอื่น ก็ต่อเมื่อคุณรู้ว่าความ
ผิดพลาดเหล่านั้นมีอะไรบ้าง
กับดักค่าเฉลี่ย
การกระจายรายได้ในสหรัฐอเมริกา
กราฟด้านบนแสดงการกระจายตัวของรายได้ในสหรัฐอเมริกา จากส้ามะโนประชากรปี 2011 ส้าหรับครัวเรือนที่มี
รายได้แต่ละระดับ สูงสุดที่ 200,000 เหรียญสหรัฐ คุณจะเห็นว่าครัวเรือนส่วนใหญ่มีรายได้ระหว่าง 15,000-
65,000 เหรียญสหรัฐ แต่เรามีหางยาวซึ่งดึงค่าเฉลี่ยให้เบ้ขึ้น
ทดสอบ: คุณมองเห็นตัวอย่างอื่นอีกไหมที่การใช้ค่าเฉลี่ยมีปัญหา?
มากกว่าแค่ค่าเฉลี่ย…
ค่าใช้จ่ายด้านสุขภาพของฟินแลนด์
ลองนึกถึงพาดหัวของกราฟสองกราฟนี้ พาดหัวส้าหรับกราฟทางซ้ายอาจเขียนว่า “ค่าใช้จ่ายด้านสุขภาพใน
ฟินแลนด์พุ่งฉุดไม่อยู่!” ส่วนกราฟทางด้านขวาอาจอยู่ใต้พาดหัว “ค่าใช้จ่ายด้านสุขภาพในฟินแลนด์ค่อนข้างทรง
ตัว” ทีนี้ลองดูข้อมูล มันคือข้อมูลชุดเดียวกันแต่น้าเสนอเป็นสองวิธี (ที่ไม่ถูกทั้งคู่)
ทดสอบ: คุณมองเห็นไหมว่ากราฟข้างต้นท้าให้คนเข้าใจผิดอย่างไร?
ก่อนอื่น ข้อมูลในกราฟทางด้านซ้ายไม่ได้เริ่มที่ 0 เหรียญสหรัฐ แต่เริ่มที่ประมาณ 3,000 เหรียญสหรัฐ ท้าให้ความ
แตกต่างระหว่างแท่งดูใหญ่กว่าความเป็นจริง เช่น ค่าใช้จ่ายระหว่างปี 2001 กับ 2002 ดูเหมือนจะเพิ่มขึ้นอย่าง
น้อยสามเท่า! ทั้งที่ความจริงไม่ใช่เลย นอกจากนี้ การเลือกแกนตั้งและแกนนอนให้มีความยาวเท่ากัน (ท้าให้กราฟ
อยู่ในกรอบสี่เหลี่ยมจัตุรัส) ก็ช่วยขับเน้นความแตกต่างให้ดูหวือหวาเข้าไปอีก
A กับ B
ทดสอบ: เราอยากแสดงว่า B มีขนาดเป็นสองเท่าของ A ภาพไหนที่ถูกต้อง? เพราะอะไร?
ค้าตอบ: ภาพทางขวามือ
เส้นเวลามักจะขาดไม่ได้เวลาแสดงข้อมูล ลองดูกราฟต่อไปนี้
ถ้าคุณตอบว่า 5 เปอร์เซ็นต์ เสียใจด้วยนะ! ค้าตอบคือ 100 เปอร์เซ็นต์ (10 เปอร์เซ็นต์ เท่ากับ 200 เปอร์เซ็นต์
ของ 5 เปอร์เซ็นต์) หรือเปลี่ยนไป 5 จุด ดังนั้นก็ระวังให้ดีในคราวต่อไปที่คุณเห็นคนรายงานผลการเลือกตั้ง ผลการ
ส้ารวจความคิดเห็นและอื่นๆ ท้านองนี้ คุณจะมองเห็นข้อผิดพลาดของพวกเขาหรือไม่?
จับขโมย – ความอ่อนไหวกับตัวเลขใหญ่ๆ
การประเมินความเป็นไปได้สูงเกินไปในกรณีที่เหตุการณ์อะไรสักอย่างถูกรายงานว่าเกิดจริงแบบนี้มีชื่อเรียกว่า
“ตรรกะวิบัติเรื่องอัตราฐาน” (base rate fallacy) ซึ่งเป็นค้าอธิบายว่าท้าไมการค้นตัวที่สนามบินและวิธีคัดกรอง
คนอื่นๆ จึงทึกทักว่าผู้โดยสารจ้านวนมากเป็นผู้ก่อการร้าย (false positive)
สรุป
ในส่วนนี้เราทบทวนความผิดพลาดที่พบบ่อยบางประการเวลาน้าเสนอข้อมูล ไม่ว่าจะใช้ข้อมูลเป็นเครื่องมือเล่า
เรื่องราว หรือสื่อสารประเด็นและข้อค้นพบของเรา ถึงแม้เราจะต้อง “ย่อย” ข้อมูลให้เข้าใจง่ายว่าข้อมูลแปลว่า
อะไร การย่อยอย่างผิดๆ ก็อาจท้าให้คนเข้าใจผิด เมื่อใดก็ตามที่คุณใช้ภาพแสดงหลักฐาน พยายามซื่อสัตย์กับ
ข้อมูลให้มากที่สุด ถ้าเป็นไปได้ก็อย่าเผยแพร่เฉพาะผลการวิเคราะห์ของคุณอย่างเดียว แต่จงปล่อยข้อมูลดิบ
ออกมาพร้อมกันเลย!
—–