You are on page 1of 35

งานนี้เผยแพร่ภายใต้ลิขสิทธิ์ Creative Commons แบบ Attribution Non-commercial Share

Alike (by-nc-sa) โดยผู้สร้างอนุญาตให้ท้าซ้้า แจกจ่าย แสดง และสร้างงานดัดแปลงจากส่วนใดส่วน


หนึ่งของงานนี้ได้โดยเสรี แต่เฉพาะในกรณีที่ให้เครดิตผู้สร้าง ไม่น้าไปใช้ในทางการค้า และเผยแพร่
งานดัดแปลงภายใต้ลิขสิทธิ์เดียวกันนี้เท่านั้น

เผยแพร่ครั้งแรกบนเว็บไซต์ http://www.thaipublica.org/

อินโฟกราฟฟิกที่ดี กันยายน 2012 - มีนาคม 2013

สฤณี อาชวานันทกุล

ยิ่งอินเทอร์เน็ตกลายเป็นส่วนส้าคัญของชีวิตประจ้าวัน การน้าเสนอข้อมูลด้วยกราฟฟิกสวยๆ หรือที่มีการ


บัญญัติศัพท์ “อินโฟกราฟฟิก” (Infographic) ดูจะยิ่งเป็นแฟชั่นที่ระบาดไปทั่วทุกหัวระแหง

ในเมื่อธรรมชาติของการเสพข้อมูลบนเว็บคือการ ‘กวาดสายตา’ ไปเร็วๆ บนหน้อจอ คนจะคลิกเข้าไปอ่าน


รายละเอียดก็ต่อเมื่อมีอะไรที่ท้าให้ ‘เตะตา’ หรือ ‘เอะใจ’ ไม่ว่าจะอยู่ในรูปกราฟฟิก คลิปวีดีโอ หรือพาดหัว จึงไม่
น่าแปลกใจที่การท้าอินโฟกราฟฟิกจะกลายเป็นกระแสฮอตฮิตติดลมบนอย่างรวดเร็ว และอินโฟกราฟฟิกหลายชิ้น
ก็ทั้ง ‘สวย’ และ ‘สื่อ’ ข้อมูลอย่างทรงพลัง (ดูตัวอย่างดีๆ ได้จากเว็บ Information is Beautiful)

อินโฟกราฟฟิกชั้นเลิศอาจดีถึงขนาดที่ไม่ได้มีดีแต่ ‘สวย’ และ ‘สื่อ’ เนื้อหาที่ต้องการจะสื่อเท่านั้น แต่ก่อนจบ


กระบวนการยังท้าให้ตัวคนท้าเองได้เรียนรู้อะไรใหม่ๆ เกี่ยวกับข้อมูลที่ไม่เคยรู้มาก่อน ส่วนหนึ่งเนื่องจากปัจจุบันมี
โปรแกรมมากมายที่ช่วยในการท้าความเข้าใจและแสดงผลข้อมูลในทางที่เอื้อต่อการสร้างความเข้าใจใหม่ๆ
โดยเฉพาะข้อมูลชุดมหึมาที่เราเคยต้องเสียเวลามหาศาลและใช้ระเบียบวิธีทางสถิติที่สลับซับซ้อนกว่าจะมองเห็น
‘แบบแผน’ ที่ซ่อนอยู่ข้างใต้
ข้อมูลคือหัวใจ

ก่อนอื่น อยากพูดถึงเรื่องที่คิดว่าเป็น ‘หัวใจ’ ของการท้าอินโฟกราฟฟิกที่ดี นั่นคือ ความเข้าใจใน ความหมายของ


ข้อมูล

“อินโฟกราฟฟิก” มีทั้งค้าว่า “อินโฟ” (ข้อมูล) กับ “กราฟฟิก” (ภาพ) แต่ผู้เขียนสังเกตด้วยความหดหู่ใจว่าอินโฟ


กราฟฟิกส่วนใหญ่ที่ได้พานพบระหว่างการท่องเว็บ ทั้งของไทยและเทศ เน้น “กราฟฟิก” มากกว่า “อินโฟ” จนบด
บังหรือบิดเบือนข้อมูล หรือไม่ก็ท้าให้นึกสงสัยขึ้นมาตะหงิดๆ ว่า ไอ้ที่ดูอยู่นี่มันเรียกว่า “อินโฟกราฟฟิก” ตรงไหน
ได้ เพราะมีอินโฟอยู่เพียง 1-2 เปอร์เซ็นต์!

อินโฟกราฟฟิกที่เตะตาคนอย่างเดียวแต่สื่อสารข้อมูลไม่รู้เรื่อง ไม่ถูกต้อง หรือทั้งสองอย่าง ก็ไม่ต่างจากหนังสือที่


ปกสวยแต่ข้างในกลวงเปล่า หรืออาหารที่ดูน่ากินแต่พอค้าแรกเข้าปากไปแล้วก็กินไม่ลงอีกเลย

ผู้เขียนไม่มีความรู้หรือความสามารถใดๆ ในเรื่องการท้าอินโฟกราฟฟิกให้ ‘สวย’ แต่ในฐานะคนที่ท้างานกับข้อมูล


และคุ้นเคยกับการนั่งจ้องตัวเลขติดกันเป็นพืดมานาน อยากเริ่มแลกเปลี่ยนเรื่องนี้ด้วยการยกตัวอย่างอินโฟ
กราฟฟิกสองชิ้นที่สะท้อนความเข้าใจผิดหรือรู้เท่าไม่ถึงการณ์เกี่ยวกับข้อมูล และการน้าเสนอข้อมูล

(หมายเหตุไว้ก่อนว่า ผู้เขียนเลือกตัวอย่างเหล่านี้มาอธิบายประเด็น มิได้มีเจตนาจะลบหลู่หรือประณามผู้จัดท้าแต่


อย่างใด ต้องขออภัยล่วงหน้าถ้าหากท้าให้ท่านเสียใจ แต่หวังว่าอย่างน้อยที่สุดท่านจะมองว่า ความเห็นของผู้เขียน
ในที่นี้คือความปรารถนาที่จะ ‘ติเพื่อก่อ’ เท่านั้น)

ดีไซน์ ‘สวย’ แต่ไม่ ‘สื่อ’

ปัญหาหนึ่งที่ผู้เขียนพบบ่อยคือ อินโฟกราฟฟิกจ้านวนมากดูดีแต่ท้าให้คนสับสนว่าต้องการจะสื่ออะไร เนื่องจาก


ไม่ได้จัดวางข้อมูล (โดยเฉพาะตัวเลข) ในทางที่รักษาความหมายของมันเอาไว้ ตัวอย่างหนึ่งที่สะท้อนปัญหานี้คือ
อินโฟกราฟฟิกเรื่อง “ส้ารวจราคากาแฟคาปูชิโนเย็น” จากแฟนเพจของนิตยสารฉลาดซื้อ มูลนิธิเพื่อผู้บริโภค
ปัญหาของอินโฟกราฟฟิกชิ้นนี้คือ เส้นที่ลากรูปถ้วยกาแฟแต่ละยี่ห้อไปยังราคา รวมถึงการจัดวางจ้าแหน่งถ้วย
กาแฟต่างๆ ไม่มีความเกี่ยวข้องใดๆ กับตัวเลข “ราคา” ที่แสดงเลย ยกตัวอย่างเช่น ถ้วยกาแฟขวาสุดมีราคาถูก
ที่สุด คือ 30 บาท แต่รูปถ้วยกลับอยู่สูงกว่ากาแฟถ้วยที่สองจากซ้ายที่มีราคาแพงที่สุดในรูป คือ 125 บาท ส่วนเส้น
ที่ลากจากราคา 125 บาทไปที่รูปถ้วยก็สั้นกว่าเส้นที่ลากจากถ้วยกาแฟที่ถูกกว่าบางถ้วย เช่น เส้นที่เชื่อมกาแฟกับ
ป้ายราคา 67 บาท

การที่ความยาวของเส้นและการเรียงล้าดับถ้วยกาแฟไม่มีความเกี่ยวโยงใดๆ กับตัวเลขราคา ท้าให้ ‘สาร’ หลักที่


ต้องการจะสื่อ นั่นคือ การเปรียบเทียบราคาของกาแฟคาปูชิโนยี่ห้อต่างๆ ไม่ชัดเจนเท่าที่ควร ส่งผลให้อินโฟ
กราฟฟิกชิ้นนี้แม้จะ ‘สวย’ แต่ไม่ค่อย ‘สื่อ’ – ผู้ดูต้องใช้เวลาสักพักกว่าจะเข้าใจว่ากาแฟยี่ห้ออะไรแพงกว่าอะไร

ความสับสนข้อนี้แก้ได้ง่ายๆ ด้วยการเรียงล้าดับราคาจากแพงสุดไปถูกสุด หรือถูกสุดไปแพงสุด และเปลี่ยนความ


ยาวของเส้นให้ได้สัดส่วนตามราคา คนมองปราดเดียวจะได้เห็นชัดว่ายี่ห้อไหนแพงกว่ากัน
ดีไซน์ ‘สื่อ’ แต่ ‘ผิดสาร’

บางคนอาจจะอยากใช้ “ขนาด” ของถ้วยสื่อราคาของกาแฟแต่ละยี่ห้อ ซึ่งก็ท้าได้ง่ายๆ เริ่มจากการพล็อตราคาของ


กาแฟยี่ห้อต่างๆ ลงในโปรแกรมอย่าง Microsoft Excel –

จากนั้นก็เอารูปถ้วยกาแฟแต่ละยี่ห้อมาวางแทนกราฟ ปรับความสูงของถ้วยให้เท่ากับความสูงของกราฟแท่ง (ไม่


นับหลอด) –

จุดแข็งของภาพนี้คือ นอกจากจะเห็นชัดทันทีว่ากาแฟยี่ห้อไหนแพงกว่ากันแล้ว ยังสื่อระดับความแตกต่างของราคา


ด้วย เช่น ในเมื่อกาแฟคาปูชิโนเย็นของสตาร์บัคส์แพงกว่ายี่ห้อบลูคัพประมาณ 1.5 เท่า (125 เทียบกับ 85 บาท)
และแพงกว่ากาแฟยี่ห้อแอมะซอน 2.8 เท่า (125 เทียบกับ 45 บาท) ถ้วยกาแฟสตาร์บัคส์ในรูปจึงสูงกว่าถ้วยกา
แฟบลูคัพ 1.5 เท่า และสูงกว่าถ้วยกาแฟแอมะซอน 2.8 เท่าตามล้าดับ
ทว่า จุดอ่อนที่ใหญ่กว่าจุดแข็งของภาพนี้คือ เนื่องจากมันใช้ ‘ขนาด’ ของถ้วยกาแฟแทน ‘ราคา’ จึงมีความเสี่ยงสูง
ที่ผู้ดูจะเข้าใจผิดว่า กาแฟเหล่านี้มีขนาดถ้วยแตกต่างกันมาก ทั้งที่ในความจริงไม่ใช่ และในอินโฟกราฟฟิกต้นฉบับ
รวมทั้งฉบับเลียนแบบของผู้เขียนด้านบนก็มีข้อความ “ราคาแก้วขนาดใหญ่สุดของแต่ละยี่ห้อ มีปริมาณประมาณ
22 ออนซ์ (650 มิลลิลิตร)” เพื่อสื่อว่าแต่ละถ้วยมีปริมาณกาแฟใกล้เคียงกัน

จุดอ่อนข้างต้นของภาพนี้รุนแรงจนอาจกลบ ‘สาร’ ที่มันต้องการจะสื่อ (คือแสดง ราคาเปรียบเทียบ ของกาแฟ


ชนิดเดียวกันที่มีขนาดใกล้เคียงกัน) เพราะคนมีแนวโน้มจะเข้าใจผิดว่ากาแฟเหล่านี้มีขนาดถ้วยแตกต่างกัน – และ
พวกเขาก็จะมองเห็นขนาดถ้วยก่อนราคา เพราะรูปถ้วย ‘เตะตา’ มากกว่าตัวเลข

การท้าอินโฟกราฟฟิกให้ดีจึงไม่ง่าย ต้องใช้เวลา ทักษะ ความคิดสร้างสรรค์ และความเข้าใจอย่างลึกซึ้งในข้อมูล


และสารที่ต้องการจะสื่อ คนท้า (จะท้าคนเดียวหรือเป็นทีมก็ตาม) ต้องถามตัวเองตลอดเวลาว่า ดีไซน์ของอินโฟ
กราฟฟิกนี้ตอบโจทย์หรือไม่ สื่อสารหลักที่ต้องการจะสื่อจริงๆ หรือไม่

นอกจากการใช้กราฟฟิกไม่เหมาะสม (ท้าให้คนไม่เข้าใจหรือเข้าใจข้อมูลผิด) หลายครั้งคนท้าอินโฟกราฟฟิกยัง


บกพร่องในขั้นพื้นฐานกว่านั้นอีก คือใช้รูปแบบกราฟที่ไม่เหมาะสมกับข้อมูลที่ต้องการจะสื่อ

ข้อมูลถูก กราฟผิด

ตัวอย่างของการใช้กราฟที่ไม่เหมาะสมกับข้อมูลอย่างสิ้นเชิงจนท้าให้มันสื่อสารไม่ได้ คือภาพประกอบข่าวชิ้นหนึ่ง
จากเว็บไซต์หนังสือพิมพ์ เดอะ เนชั่น - The Nation ปี 2011 (ก๊อปภาพนี้เก็บไว้นาน ผู้เขียนหาลิงก์ข่าวที่
เกี่ยวข้องไม่เจอแล้ว ขออภัยผู้อ่านทุกท่าน)
เปรียบเทียบอัตรากาไรสุทธิ บริษัทอสังหาฯ ในตลาดหลักทรัพย์

ภาพข้างต้นจั่วหัวว่า “Net Profit Drops” หรือ “ก้าไรสุทธิตก” สารหลักที่ต้องการจะสื่อคือ อัตราก้าไรสุทธิของ


บริษัทพัฒนาอสังหาริมทรัพย์ที่จดทะเบียนในตลาดหลักทรัพย์แห่งประเทศไทย ประจ้าไตรมาสแรกของปี 2011
ลดลงทุกบริษัทเมื่อเทียบกับไตรมาสแรกของปีก่อนหน้า คือ 2010

ปัญหาใหญ่ของภาพนี้คือดูออกยากมากว่าต้องการจะสื่ออะไร เนื่องจากผู้จัดท้าเลือกใช้วงกลมมาน้าเสนอข้อมูล
ของแต่ละบริษัท แทนที่จะใช้กราฟแท่งหรือเส้น (สองแท่งหรือสองเส้นต่อหนึ่งบริษัท) เพื่อสร้างความชัดเจนว่า
ก้าลังเปรียบเทียบตัวแปรเดียวกันของแต่ละบริษัท เพียงแต่ต่างปีกัน

ในภาพนี้ขนาดของวงกลมวงเล็กสีแสดแสดงอัตราก้าไรสุทธิของไตรมาสแรก ปี 2011 ส่วนขนาดของวงกลมสีด้าวง


ใหญ่รอบนอก (หลายบริษัทแทบมองไม่เห็น) แสดงอัตราก้าไรสุทธิของไตรมาสแรกปีก่อนหน้า เมื่อใดที่เราเห็น
วงกลมวงเล็กอยู่ในวงใหญ่ เราจะนึกโดยสามัญส้านึกทันทีว่า วงเล็กต้องเป็น ‘หน่วยย่อย’ (subset) ของวงใหญ่
แน่ๆ เช่นถ้าหากวงเล็กคือก้าไรสุทธิ วงใหญ่ก็น่าจะเป็นรายได้ (ซึ่งย่อมใหญ่กว่าก้าไรสุทธิ) ของปีเดียวกัน แต่ในเมื่อ
ผู้จัดท้าเลือกใช้วงกลมซ้อนวงกลมมาแสดงข้อมูล ตัวเดียวกัน แต่ ต่างปี กัน คนอ่านจึงท้าความเข้าใจกับข้อมูลได้
ยากมาก

ผู้เขียนหวังว่าตัวอย่างทั้งสองที่ยกไปข้างต้น จะชี้ให้เห็นความส้าคัญของ ‘ข้อมูล’ บ้างไม่มากก็น้อยว่า เป็น ‘หัวใจ’


ที่ขาดไม่ได้ของอินโฟกราฟฟิกทุกชิ้น และดังนั้นอินโฟกราฟฟิกที่ดีจึงไม่ได้เน้นที่ ‘สวย’ เพียงอย่างเดียว

เพราะถึงที่สุดแล้วก็อย่างที่ นาธาน เหยา (Nathan Yau) เจ้าของเว็บ Flowing Data เคยว่าไว้ในบทความชิ้น


หนึ่ง –

“ดีไซน์หรือการออกแบบไม่ได้เป็นเรื่องของการท้าให้อะไรๆ ดูสวยงามเท่านั้น แต่เป็นเรื่องของการท้าให้มันใช้การ


ได้ ซึ่งในกรณีของอินโฟกราฟฟิก มันหมายถึงการ ‘สื่อ’ ข้อมูลอย่างถูกต้องและชัดเจน มันหมายถึงการปล่อยให้
ข้อมูลได้ ‘พูด’ และไม่ใส่รูปหรือสัญลักษณ์อย่างรกรุงรังจนกลบประเด็นส้าคัญไปหมด”

ใช้กราฟให้เป็น
จากตัวอย่างกรณี “ข้อมูลถูก กราฟผิด” ข้างต้น ลองมาลงลึกในปัญหานี้ต่อ โดยตั้งต้นจากแผนภูมิและกราฟ
พื้นฐานสามประเภท เพราะประโยชน์ของการใช้กราฟคือ ลักษณะต่างๆ ของกราฟ เช่น ความยาว ความกว้าง
ขนาดของพื้นที่ ฯลฯ สามารถสื่อสารความหมายของตัวเลขอย่างชัดเจนกว่าถ้าใช้แต่ตัวเลขโดดๆ เท่านั้น
การเลือกใช้กราฟให้เหมาะสมกับข้อมูลจึงเป็นก้าวแรกๆ ที่จ้าเป็นต่อการท้าอินโฟกราฟฟิกที่ดี
ลองมาดูตัวอย่างกันสักเล็กน้อยจากแผนภูมิและกราฟพื้นฐานสามชนิด ได้แก่ แผนภูมิวงกลม แผนภูมิแท่ง และ
กราฟเส้น

1. แผนภูมิวงกลม

แผนภูมิวงกลม (pie chart) เหมาะส้าหรับการสื่อ “สัดส่วน” ขององค์ประกอบต่างๆ ของข้อมูลในประเด็น


เดียวกัน บันทึกในช่วงเวลาเดียวกัน คือทุกกลุ่มบวกรวมกันได้ 100% ตัวอย่างสมมุติเช่น 20% ของผู้สูบบุหรี่ใน
ประเทศ ก.ไก่ มีอายุน้อยกว่า 18 ปี, 25% อายุระหว่าง 18-30 ปี, 40% อายุระหว่าง 30-60 ปี และที่เหลืออีก
15% มีอายุเกิน 60 ปี เป็นต้น หรือจะใช้สื่อตัวเลขสองตัว คือ X% กับ 100%-X% (คือไม่ใช่ X) ก็ได้ เช่น
“ประเทศ ก.ไก่ ทั้งประเทศมีประชากรที่สูบบุหรี่ 35% ประชากรอีก 65% ไม่สูบ”
ข้อควรระวังในการใช้แผนภูมิวงกลมคือ ต้องมั่นใจว่าสัดส่วนต่างๆ ที่จะน้ามาพล็อตใส่แผนภูมินั้นเป็นส่วนเสี้ยวของ
เรื่องเดียวกัน ไม่ใช่คนละเรื่องกัน และบวกกันได้ทั้งหมดหรือ 100% จริงๆ เพราะไม่อย่างนั้นอาจก่อให้เกิดความ
เข้าใจผิดได้ ยกตัวอย่างเช่นแผนภูมิวงกลมที่ผู้เขียนสมมุติขึ้นเองต่อไปนี้ –

จานวนคนไทยที่สูบบุหรี่ ซื้อหวย และดื่มสุรา (ตัวเลขสมมุติ)

แผนภูมิวงกลมข้างต้น (ซึ่งผู้เขียนสมมุติตัวเลขเองทั้งหมด) บอกเราว่า มีคนไทย 15 ล้านคนที่ซื้อหวย คนไทย 10


ล้านคนสูบบุหรี่ และคนไทย 25 ล้านคนดื่มสุรา ปัญหาคือการน้าตัวเลขเหล่านี้มาแสดงในแผนภูมิวงกลมท้าให้คน
อ่านเข้าใจผิด คิดว่าข้อมูลเป็นเอกเทศไม่ทับซ้อนกันเลย เช่น คน 25 ล้านคนที่ดื่มสุราไม่ซื้อหวยและไม่สูบบุหรี่
ส่วนคนที่สูบบุหรี่ 10 ล้านคนก็ไม่ดื่มสุราและไม่ซื้อหวย ทั้งที่ความจริงย่อมไม่ใช่ คนที่ดื่มสุราหลายคนซื้อหวยหรือ
สูบบุหรี่ หรือทั้งสองอย่าง

ปัญหาของแผนภูมิวงกลมข้างต้นอีกประการหนึ่งคือ ตัวเลขสามตัวบวกกันได้เพียง 10+15+25 = 50 ล้านคน น้อย


กว่าจ้านวนประชากรทั้งประเทศที่มี 65 ล้านคน ถึง 65-50 = 15 ล้านคน ก่อให้เกิดค้าถามว่าอีก 15 ล้านคน
หายไปไหน คือจ้านวนคนไทยที่ไม่ดื่มสุรา ไม่สูบบุหรี่ และไม่ซื้อหวยหรืออย่างไร

ค้าถามนี้ส้าคัญ แต่มันไม่โผล่มาง่ายๆ เพราะถ้าใครดูแผนภูมิวงกลมแวบแรกจะนึกว่าวงกลมทั้งวงคือ 100% ซึ่งใน


ที่นี้คือประชากรไทยทั้งประเทศ กว่าจะนึกได้ว่าวงกลมวงนี้ไม่ใช่ 100% ก็จะต้องฉุกใจคิด บวกตัวเลขในส่วนเสี้ยว
ต่างๆ เองเสียก่อน
อินโฟกราฟฟิกบางชิ้นเลือกใช้แผนภูมิวงกลม แต่สื่อมันออกมาไม่ชัด ท้าให้มันไร้ความหมายอย่างน่าเสียดาย
ตัวอย่างเช่นอินโฟกราฟฟิกเรื่อง “หวยไม่มีวันตายไปจากสังคมไทยจริงหรือ?” โดยมูลนิธิ a day –

“หวยไม่มีวันตายไปจากสังคมไทยจริงหรือ” โดย a day Foundation


(ที่มา: เว็บไซต์ Creative Move)

ภาพนี้ตัวเลขเปอร์เซ็นต์ต่างๆ มองเห็นแต่ไกล แต่วงกลมเหนือตัวเลขเหล่านั้นต้องซูมเข้าไปดูใกล้ๆ ถึงจะเห็นว่าดีไซ


เนอร์ใช้แผนภูมิวงกลม เพราะขนาดของรัศมีวงกลมเล็กเกินไป สีเทาอ่อนกับเทาเข้มที่ใช้ระบายส่วนเสี้ยวของ
วงกลมก็ดูคล้ายกันเกินไป (แผนภูมิวงกลมที่มี “รู” ตรงกลางนั้นมีชื่อเรียกเป็นภาษาสถิติทางการว่า “แผนภูมิ
โดนัท”)

ถ้าจะใช้ประโยชน์จากแผนภูมิวงกลมจริงๆ ดีไซเนอร์ก็ควรท้าแผนภูมิวงกลมให้เด่นชัด อย่างเช่น –

สัดส่วนของคนที่ตอบว่า “เคยซื้อหวย” แบ่งตามกลุ่มรายได้ (ผู้เขียนเพิ่มแผนภูมิวงกลม)

2. แผนภูมิแท่ง

แผนภูมิพื้นฐานประเภทที่สองคือ แผนภูมิแท่ง (bar chart) ไม่ว่าจะแนวตั้งหรือแนวนอน แผนภูมิประเภทนี้เหมาะ


ส้าหรับการ “เปรียบเทียบ” ข้อมูลต่างชนิดในเวลาเดียวกัน หรือชนิดเดียวกันแต่ต่างเวลากัน ประเด็นส้าคัญคือ
ต้องเป็นข้อมูลที่มี “หน่วย” เดียวกัน เช่น ล้านบาท กิโลกรัม กิโลเมตรต่อชั่วโมง ฯลฯ

ถ้าจะให้ดียิ่งไปกว่านั้นอีกคือ เลือกหน่วยที่ท้าให้การเปรียบเทียบนั้นเป็นประโยชน์ คือ “สื่อ” ความหมายของ


ข้อมูลได้อย่างชัดเจน ตรงประเด็น คนอ่านไม่ต้องไปหาข้อมูลเพิ่มเติม

ยกตัวอย่างเช่น ถ้าเราแสดงแผนภูมิแท่งเปรียบเทียบ “ปริมาณการดื่มเบียร์” ของประชากรประเทศต่างๆ ในกลุ่ม


ประเทศอาเซียน โดยใช้หน่วย “ล้านลิตรต่อปี” แผนภูมินี้ก็จะดูน่าสนใจประมาณหนึ่ง แต่ในเมื่อแต่ละประเทศมี
จ้านวนประชากรไม่เท่ากัน และคนทั่วไปก็ไม่รู้ว่าแต่ละประเทศมีคนมากน้อยต่างกันอย่างไร การบอกว่าคน
อินโดนีเซียดื่มเบียร์ 236 ล้านลิตรในปี 2011 ขณะที่คนไทยดื่มเบียร์ 1,805 ล้านลิตร จึงไม่น่าสนใจเท่ากับถ้าน้า
ตัวเลขปริมาณเบียร์มาหารด้วยจ้านวนประชากรของแต่ละประเทศ ให้หน่วยออกมาเป็น “ลิตรต่อคนต่อปี” ก่อนที่
จะพล็อตลงแผนภูมิ คนอ่านจะได้มองเห็นอย่างชัดเจนว่าคนไทยดื่มเบียร์มากกว่าคนอินโดนีเซียหลายเท่าจริงๆ
ไม่ใช่เพราะประเทศอินโดนีเซียเล็กกว่าประเทศไทยแต่อย่างใด (ซึ่งไม่จริง แต่เป็นข้อมูลเพิ่มเติมที่คนอ่านต้องไป
ควานหา ถ้าอยากเข้าใจความหมายของข้อมูลที่เราน้าเสนอ)
ตัวอย่างแผนภูมิแท่งอันหนึ่งที่ผู้เขียนชอบคือ อินโฟกราฟฟิก “Fun facts for coffee lovers” ของบริษัท
Staples แสดงปริมาณคาเฟอีนต่อถ้วยของเครื่องดื่มประเภทต่างๆ รวมถึงกระทิงแดง (ในยี่ห้อที่ฝรั่งคุ้นเคยคือ
Red Bull) โค้ก และชาเขียว –

“Fun facts for coffee lovers” โดย Staples


(ที่มา: เว็บ Staples)
ถ้า “จัดวาง” ข้อมูลอย่างดี ล้าพังแผนภูมิแท่งที่เรียบง่ายหนึ่งภาพก็สามารถสื่อความหมายได้ดีกว่าการแจกแจง
ตัวเลขนับสิบๆ ตัว ตัวอย่างหนึ่งที่ผู้เขียนชอบใช้สาธิตประเด็นนี้ คือแผนภูมิ “Biggest military spenders” ของ
วารสาร ดิ อีโคโนมิสต์ แสดงงบประมาณทางทหารของประเทศต่างๆ ที่ใช้งบประมาณด้านนี้สูงที่สุดในโลกในปี
2010 ตัวเลขในกล่องข้างชื่อประเทศแสดงสัดส่วนของงบประมาณดังกล่าวต่อจีดีพี –

“Biggest military spenders” โดย The Economist

ภาพนี้มีแผนภูมิแนวตั้งเพียงสองแท่งเท่านั้น แท่งสีส้มด้านซ้ายแสดงงบประมาณทางทหาร ปี 2010 ของ


สหรัฐอเมริกา ส่วนแท่งทางขวาน้างบประมาณทางทหารในปีเดียวกันของประเทศอื่นที่ใช้งบทหารสูงสุดอีก 14
ประเทศ มาซ้อนเรียงกันเป็นแท่งเดียว
ภาพนี้สื่อความว่า “สหรัฐอเมริกาประเทศเดียวใช้งบประมาณทางทหารมากกว่าประเทศที่ใช้งบทหารรองลงมา 14
ประเทศรวมกัน” ได้อย่างชัดเจนและแทบจะในทันทีที่มองเห็น

ลองนึกดูว่า ถ้า ดิ อีโคโนมิสต์ ไม่น้าตัวเลขของประเทศต่างๆ มาตั้งซ้อนกันแบบนี้ แต่จัดเรียงเป็นแผนภูมิแท่ง


ตามปกติ หนึ่งแท่งแสดงตัวเลขหนึ่งประเทศเหมือนอเมริกา เราจะ “อ่าน” ความหมายนี้ออกหรือไม่

3. กราฟเส้น

กราฟพื้นฐานประเภทสุดท้ายคือ กราฟเส้น เหมาะส้าหรับการน้าเสนอ “ความเปลี่ยนแปลง” ที่เกิดขึ้นกับข้อมูลตัว


ใดตัวหนึ่งผ่านกาลเวลา หรือที่เรียกว่า ข้อมูลอนุกรมเวลา (time series data) โดยทั่วไปนิยมแสดงข้อมูลจากอดีต
ทางด้านซ้าย ข้อมูลจากปัจจุบันทางด้านขวา ถ้าจะให้ดีควรเป็นข้อมูลที่มีการเก็บบันทึกเป็นระยะๆ อย่างสม่้าเสมอ
เช่น รายไตรมาสหรือรายเดือน เพราะการลากจุดเชื่อมจุดข้อมูลแต่ละจุดเป็นเส้นย่อมท้าให้คนอ่านคาดหวัง
“ความต่อเนื่อง” ของข้อมูล

ตัวอย่างอินโฟกราฟฟิกแบบกราฟเส้นชิ้นหนึ่งที่ผู้เขียนชอบ คือ “Who in Washington is responsible for U.S.


debt?” โดยบริษัทออกแบบชื่อ Elefint Design –
“Who in Washington is responsible for U.S. debt?” โดย Elefint Designs
(ที่มา: เว็บ Elefint Designs)

กราฟเส้นชิ้นนี้ไม่เพียงแต่แสดงข้อมูลหลักสองชิ้น คือสัดส่วนหนี้สาธารณะของสหรัฐต่อจีดีพี (เส้นบน) กับสัดส่วน


ผลขาดดุลหรือเกินดุลงบประมาณต่อจีดีพี (เส้นล่าง) แต่ยังระบายสีเส้นแต่ละช่วงตามสังกัดพรรคการเมืองของ
ประธานาธิบดีในอ้านาจ และระบายแถบสีรอบเส้นใหญ่อีกทีเพื่อแสดงพรรคการเมืองที่มีเสียงข้างมากในสภาคองเก
รส – ทั้งหมดนี้เพื่อมุ่งตอบค้าถามที่ตั้งในชื่อของอินโฟกราฟฟิกว่า ตกลงพรรคไหนต้อง “รับผิดชอบ” กับหนี้
สาธารณะของอเมริกา (ค้าตอบจากกราฟคือ “ทั้งคู”่ )

การเลือกใช้แผนภูมิและกราฟอย่างเหมาะสม ไม่เพียงแต่ท้าให้ดีไซเนอร์ (ซึ่งจะให้ดีก็ไม่ควรเป็นคนคนเดียว แต่เป็น


ทีมดีไซเนอร์ที่มีทั้งนักออกแบบ นักวิเคราะห์ข้อมูล และ “เจ้าของเรื่อง” ที่เข้าใจประเด็น) สามารถสื่อสารข้อมูลได้
อย่างทรงพลัง แต่ยังช่วยให้คนอ่านเข้าใจ “ความหมาย” ของชุดข้อมูลนั้นๆ ได้อีกด้วย
กล่าวโดยสรุป แผนภูมิวงกลมเหมาะส้าหรับการแสดง “สัดส่วน” ของสิ่งที่บวกกันได้ 100% แผนภูมิแท่งเหมาะ
ส้าหรับการ “เปรียบเทียบ” ข้อมูลในหน่วยเดียวกัน ส่วนกราฟเส้นเหมาะส้าหรับการแสดง “ความเปลี่ยนแปลง”
ที่เกิดขึ้นในแต่ละช่วงเวลา แน่นอนว่าโลกนี้มีกราฟและแผนภูมิชนิดอื่นอีกมากมาย แต่การรู้วิธีใช้แผนภูมิและกราฟ
พื้นฐานสามชนิดนี้ก็น่าจะเป็นจุดเริ่มต้นที่ดีของการสร้างอินโฟกราฟฟิกที่ใช้ตัวเลข ไม่ว่าจะเป็นเรื่องอะไรก็ตาม

“สือ่ ” ให้เห็น “ความหมาย”

ในเนื้อหาข้างจ้นผู้เขียนยกตัวอย่างเพื่อชี้ความส้าคัญของ “ข้อมูล” และการใช้กราฟให้ “เป็น” คือสอดคล้อง


เหมาะสมกับข้อมูล ในการสร้าง “ข้อมูลภาพ” หรืออินโฟกราฟฟิก ซึ่งก้าลังฮิตติดลมบนในโลกออนไลน์ของไทย ไม่
ต่างจากที่ฮิตในโลกออนไลน์ประเทศอื่น

แต่น่าเสียดายที่อินโฟกราฟฟิกภาษาไทยที่ “ดี” ยังมีอยู่เพียงหยิบมือเดียวเท่านั้น

ปัญหาของอินโฟกราฟฟิกส่วนใหญ่คือ เอาข้อมูลพื้นๆ ไม่กี่ตัวมาท้าให้ดูขรึมขลังอลังการ ราวกับว่ามันบอกอะไรๆ


เราได้มากมาย

ดูแวบแรกรู้สึกว่า “สวยดี” แต่หลังจากนั้นสามวินาทีก็ถึงบางอ้อว่า “ไม่เห็นมีอะไรเลย”

ถึงแม้ “ตัวเลข” จะส้าคัญ เอาเข้าจริงอินโฟกราฟฟิกหลายกรณีไม่จ้าเป็นจะต้องเน้นข้อมูลเชิงปริมาณ (ซึ่งมักจะ


ต้องอาศัยกราฟ และที่ส้าคัญกว่านั้นคือความสามารถในการวิเคราะห์ข้อมูล) ก็ได้ จะเน้นข้อมูลเชิงคุณภาพ (มัก
แสดงออกผ่านถ้อยค้า) เป็นหลักก็ได้ แต่สาระส้าคัญก็เหมือนกัน นั่นคือ ต้องใช้ “ค้า” และ “ภาพ” ให้สามารถ
“สรุป” และ “สื่อ” ใจความส้าคัญที่ต้องการจะสื่อได้

อินโฟกราฟฟิกที่เต็มไปด้วยตัวเลข แต่ไม่รู้ว่าประเด็นคืออะไร หรือเต็มไปด้วยข้อความติดกันเป็นพืด ก็ไม่ต่างจาก


งานเขียนแย่ๆ ที่จับต้นชนปลายไม่ได้ คล้ายคนเขียนยังไม่รู้ว่าตัวเองต้องการจะสื่ออะไร “ประเด็น” อยู่ตรงไหน

อินโฟกราฟฟิกเน้นข้อมูลเชิงคุณภาพหลายชิ้นอัดเนื้อหาเต็มพื้นที่จนคนอ่านตาลาย ภาพประกอบและสัญลักษณ์
ต่างๆ ที่ใช้ก็ไม่ค่อยเกี่ยวกับเนื้อหา ไม่ได้สื่อประเด็นอะไรเท่ากับเอาไว้ “พักสายตา” คนอ่านมากกว่า ถ้าผู้ผลิตไป
ท้าเป็นสื่อสิ่งพิมพ์แจกอย่างเช่นแผ่นพับ หรือเขียนเป็นบทความน่าจะเหมาะสมกว่ากันมาก เพราะเหมือน “ความ
เรียง” มากกว่า “อินโฟกราฟฟิก” ที่ท้าเพื่อการสื่อสารออนไลน์เป็นหลัก

ตัวอย่างอินโฟกราฟฟิกที่เข้าข่ายนี้คือชิ้นที่ใช้ชื่อว่า “สื่อสาธารณะ” ผลิตโดยสถาบันวิชาการสื่อสาธารณะ ไทยพีบี


เอส (สวส.) –
สื่อสาธารณะ (Public Media) โดย สถาบันวิชาการสื่อสาธารณะ

ลองเปรียบเทียบอินโฟกราฟฟิกด้านบนกับกราฟฟิกของ Matra Law เพจของทีมผู้พัฒนาประมวลกฎหมายไทย


ส้าหรับใช้งานบนไอโฟนและไอแพดรายแรก –
ห้างรับผิดชอบแน่นอนถ้ารถหาย ที่มา: เพจ Matra Law
เลิกกันไม่ใช่เนรคุณ ที่มา: เพจ Matra Law

ใครปราดตามองกราฟฟิกง่ายๆ สองชิ้นนี้ก็เข้าใจแล้วว่าต้องการจะสื่ออะไร ที่จริงสองชิ้นนี้อาจเรียกว่า “อินโฟ


กราฟฟิก” ไม่ได้เต็มปากนัก เพราะ ‘ง่าย’ และ ‘สั้น’ เกินไป เหมือน “flash card” บัตรสามคูณห้านิ้วที่ใช้ท่อง
ข้อมูลเตรียมสอบมากกว่า แต่ผู้เขียนยกมาอ้างในที่นี้เพราะเป็นตัวอย่างที่ดีของการใช้ “ค้า” อย่างมีประสิทธิภาพ
ในอินโฟกราฟฟิก คือท้าได้ดีทั้งการเลือกค้าและการจัดวางค้า ท้าให้คนอ่านมองเห็นประเด็นที่ผู้สร้างต้องการจะสื่อ
อย่างชัดเจนโดยไม่ต้องใช้สมาธิขั้นสูง

(เพจ Matra Law น้าเสนอเกร็ดกฎหมายน่าสนใจด้วยการจัดท้ากราฟฟิกสั้นๆ แบบนี้ อัพโหลดเป็นรูปบนเฟซบุ๊ก


ประกอบค้าอธิบายด้านข้าง กราฟฟิกส่วนใหญ่ต้องอ่านค้าอธิบายประกอบจึงจะเข้าใจตัวบทและบริบทอย่าง
ครบถ้วน)
เปรียบเทียบให้ถูกต้อง

ไม่ว่าจะใช้กราฟฟิกสวยงามเพียงใดหรือมีมือดีไซน์เจ๋งขนาดไหน ข้อมูลจ้านวนมากก็ยากแก่การท้าความเข้าใจอยู่ดี
โดยเฉพาะข้อมูลเชิงปริมาณที่มีหลายหลัก (เช่น เงินหลักแสนล้านหรือล้านล้าน) และข้อมูลเชิงเปรียบเทียบ เช่น
ข้อมูลตัวเดียวกันแต่เปรียบเทียบข้ามบริษัท ข้ามอุตสาหกรรม หรือข้ามประเทศ

ความเสี่ยงของการใช้ข้อมูลเชิงเปรียบเทียบคือ การใช้โดยไม่คิดให้ดีก่อนว่าข้อมูลนั้นเปรียบเทียบกันได้หรือไม่ และ


เปรียบเทียบแบบนี้แปลว่าอะไร ใช้ข้อมูลที่หาได้แบบลุ่นๆ สุ่มเสี่ยงต่อการสร้างความเข้าใจผิด

ยกตัวอย่างเช่น ลองดูภาพแสดงปริมาณเบียร์ที่คนดื่มในทวีปเอเชียตะวันออกเฉียงใต้ ตลอดปี 2011 แยกราย


ประเทศ จากส้านักข่าว AFP –

ความกระหายเบียร์ของเอเชียตะวันออกเฉียงใต้ (ล้านลิตร)
ที่มา: AFP
ภาพนี้บอกว่า คนเวียดนามดื่มเบียร์มากที่สุดในภูมิภาค คือ 2,595 ล้านลิตร ตามด้วยไทย 1,805 ล้านลิตร และ
ฟิลิปปินส์ 1,622.7 ล้านลิตร

แต่ “ความหมาย” ของข้อมูลนี้คืออะไร? บทสรุปจากภาพนี้คือ “คนเวียดนามดื่มเบียร์มากที่สุดในเอเชียตะวันออก


เฉียงใต้” ซึ่งก็ไม่ผิดเพราะตัวเลขปริมาณสื่ออย่างนั้น แต่อาจท้าให้คนเข้าใจผิดได้ เพราะแต่ละประเทศมีประชากร
ไม่เท่ากัน ถ้าหากคนทุกประเทศดื่มเบียร์เท่ากันหมด (เช่น คนละ 20 ลิตรต่อปี) ตัวเลขของประเทศใหญ่อย่าง
อินโดนีเซียก็จะต้องสูงกว่าประเทศเล็กอย่างสิงคโปร์ แต่คงไม่ถูกต้องถ้าจะบอกว่า “คนอินโดนีเซียดื่มเบียร์มากกว่า
คนสิงคโปร์”

การป้องกันความเข้าใจผิดนี้ท้าได้ง่ายๆ ด้วยการหาตัวเลขประชากรของแต่ละประเทศมาหารปริมาณเบียร์ที่บริโภค
ผลลัพธ์ที่ได้คือ “ปริมาณเบียร์ต่อหัว” ดังภาพนี้ –
ความกระหายเบียร์ของเอเชียตะวันออกเฉียงใต้ (ลิตรต่อหัว)
ที่มา: ผู้เขียน ดัดแปลงจากข้อมูล AFP

ข้อมูลนี้ท้าให้เราตอบค้าถาม “คนชาติไหนดื่มเบียร์มากกว่ากัน” ได้อย่างเต็มปาก จะเห็นว่าบางอันดับไม่


เปลี่ยนแปลง เวียดนามยังครองแชมป์ที่ 29.55 ลิตรต่อคนต่อปี ไทยยังตามมาเป็นที่สอง คือ 27.39 ลิตรต่อคนต่อปี
และเมียนมาร์ก็ยังรั้งท้ายที่ 0.6 ลิตรต่อคนต่อปี แต่ลาวกับสิงคโปร์แซงหน้าฟิลิปปินส์ขึ้นมาเป็นอันดับที่สามและสี่
ตามล้าดับ

แน่นอน ผู้สร้างอินโฟกราฟฟิกต้นฉบับอาจไม่ได้อยากตอบค้าถามว่าชนชาติไหนดื่มเบียร์มากกว่ากัน อาจจะอยาก


น้าเสนอปริมาณรวมเพราะจะได้ชี้ว่า “ตลาดเบียร์” ประเทศไหนใหญ่กว่ากัน แต่ประเด็นที่ผู้เขียนอยากชี้คือ การใช้
ข้อมูลเชิงเปรียบเทียบลักษณะนี้สุ่มเสี่ยงที่จะท้าให้คนเข้าใจผิดได้ง่าย ไม่ว่าจะเป็นประเด็นที่ผู้สร้างต้องการจะสื่อ
หรือเป็นประเด็นอื่น ด้วยเหตุนี้ การ “แปลง” ข้อมูลดิบ เช่น ด้วยการ “ถ่วงน้้าหนัก” ด้วยข้อมูลอีกชุดหนึ่งก่อน
เพื่อให้เปรียบเทียบกันได้จริงๆ และป้องกันการเข้าใจผิด จึงมักจะเป็นขั้นตอนที่จ้าเป็นต่อการน้าเสนอข้อมูลเชิง
เปรียบเทียบ

ตัวอย่างสื่อที่น้าเสนอข้อมูลเชิงเปรียบเทียบได้ดีมากคือ วารสาร ดิ อีโคโนมิสต์ โดยเฉพาะการเปรียบเทียบ ราคา


หรือ ก้าลังซื้อ ของคนในประเทศต่างๆ ทั้งที่กองบรรณาธิการท้าเอง หรือที่อ้างอิงจากรายงานของนักวิเคราะห์

ตัวอย่างหนึ่งที่เข้ากับตัวอย่างเบียร์ข้างต้น คือ กราฟ “Beer and Labour” (เบียร์กับการท้างาน) –

Beer and Labour


ที่มา: http://www.economist.com/blogs/graphicdetail/2012/09/daily-chart-13

ส้าหรับกราฟนี้ ดิ อีโคโนมิสต์ แสดงผลการค้านวณของนักวิเคราะห์จากยูบีเอส สถาบันการเงินชื่อดัง เขาน้าราคา


ขายปลีกเบียร์ขนาด 500 มิลลิลิตรในแต่ละประเทศ มาหารด้วยค่าจ้างรายชั่วโมงเฉลี่ยของประเทศนั้นๆ ผลลัพธ์ที่
ได้ตอบค้าถาม “เราต้องท้างานกี่นาทีถึงจะมีเงินพอซื้อเบียร์หนึ่งกระป๋องได้?”

น่าสังเกตว่าค่าเฉลี่ยของ 150 ประเทศทั่วโลกคือ 20 นาที ของไทยสูงกว่าค่าเฉลี่ยโลกเล็กน้อย คือคนไทยโดยเฉลี่ย


ต้องท้างานราว 22 นาที ถึงจะมีสตางค์พอซื้อเบียร์ ขณะที่คนอเมริกันโดยเฉลี่ยท้างานแค่ 5 นาทีก็มีเงินซื้อเบียร์
แล้ว แต่คนไทยก็ยังต้องท้างานซื้อเบียร์น้อยกว่าคนเวียดนาม แชมป์ดื่มเบียร์ในเอเชียตะวันออกเฉียงใต้ – คน
เวียดนามโดยเฉลี่ยต้องท้างานถึง 28 นาที ถึงจะมีเงินซื้อเบียร์ขนาด 500 มิลลิลิตร

เชื่อมข้อมูลมาใกล้ตัว

ความน่าสนใจของข้อมูลที่ยูบีเอสน้าเสนอข้างต้นไม่ได้อยู่ที่การเลือกใช้วิธีเปรียบเทียบที่ “มีความหมาย” อย่าง


เดียว แต่ยังอยู่ที่ความฉลาดในการเชื่อมข้อมูลมา “ใกล้ตัว” คนอ่าน ในที่นี้คือ “ก้าลังซื้อเบียร์”

ลองนึกดูว่าถ้านักวิเคราะห์แสดงราคาเบียร์ในประเทศต่างๆ (ในทางที่เทียบกันได้ เช่นแสดงในสกุลเงินเดียวกัน


ส้าหรับเบียร์ขนาดเดียวกัน) อย่างเดียว คนอ่านก็คงสนใจพอประมาณ แต่การเปรียบเทียบกับค่าจ้างเฉลี่ยราย
ชั่วโมงช่วยยกระดับความน่าสนใจไปอีกขั้น เพราะท้าให้คนอ่านเชื่อมโยงมาถึงตัวเองได้ทันทีว่า ฉันจะต้องท้างานแค่
ไหนถึงจะมีเงินไปซื้อเบียร์

กล่าวโดยทั่วไป การน้าเสนอข้อมูลเชิงปริมาณที่ผู้สร้างตั้งใจจะเน้นเรื่อง “ขนาด” โดยเฉพาะขนาด “มหาศาล”


ของอะไรสักอย่างนั้น ล้าพังการใช้กราฟหรือตัวเลขเพียวๆ มักจะไม่ช่วยให้ใครเข้าใจ โดยเฉพาะคนอ่านที่ปกติไม่ได้
ท้างานกับตัวเลข วันๆ อยู่กับโปรแกรมไมโครซอฟต์เอ็กเซลมากกว่าแฟน

การเชื่อมข้อมูลมาใกล้ตัว ในขนาดและบริบทที่คนเข้าใจ (human scale) จึงเป็นวิธีที่น่าเรียนรู้และน่าใช้ในการ


น้าเสนอข้อมูล โดยเฉพาะข้อมูลที่อยากเน้น “ขนาด” ให้คนรู้สึก

การเชื่อมข้อมูลมาใกล้ตัวนั้นท้าได้หลายวิธี การวิเคราะห์ศึกษาหาข้อมูลเพิ่มเติม เพื่อน้าเสนอข้อมูลเชิงเปรียบเทียบ


อย่างเช่น “เวลาท้างานที่ต้องใช้ก่อนซื้อเบียร์ได้ในแต่ละประเทศ” แทนที่ “ราคาเบียร์ในประเทศต่างๆ” ข้างต้นก็
เป็นวิธีหนึ่งที่นิยมใช้กันอย่างแพร่หลายขึ้นเรื่อยๆ
มาลองดูอีกตัวอย่าง แพ็คเกจอุ้มภาคการเงินที่สภาคองเกรสอเมริกันอนุมัติตั้งแต่ปี 2008 เพื่อกอบกู้เศรษฐกิจจาก
วิกฤตแฮมเบอร์เกอร์นั้นมีมูลค่ามหาศาลถึง 8,439,120,000,000 เหรียญสหรัฐ หรือ 8.43 ล้านล้านเหรียญสหรัฐ

ค้าถามคือจะท้าอย่างไรให้คนเข้าใจตัวเลขที่ “ใหญ่” ขนาดนี้?

ค้าตอบของเว็บไซต์แห่งหนึ่ง (ขออภัย ผู้เขียนเซฟมานานมากแล้วโดยลืมจด URL ที่มา) คือ น้าเสนอตัวเลขนี้เชิง


เปรียบเทียบ 4 แบบ –

The
Numbers, The Taxes, The History & The Value
แบบแรก The Numbers (ตัวเลข) ค้านวณว่าครอบครัวอเมริกันแต่ละครอบครัวต้องรับภาระแพ็คเกจอุ้ม
ครอบครัวละเท่าไร (ประมาณ 55,198 เหรียญสหรัฐต่อครอบครัว)

แบบที่สอง The Taxes (ภาระภาษี) ค้านวณว่าถ้ารัฐต้องเก็บภาษีเพิ่มเพื่อเอามาอุดช่องโหว่ (เพราะเงินอุ้มคือเงิน


ภาษีประชาชนทั้งนั้นไม่วันนี้ก็วันหน้า) คุณจะต้องจ่ายภาษีตลอด 30 ปีข้างหน้ารวมเป็นเงินเท่าไร ถ้ามีรายได้ปีละ
50,000 เหรียญสหรัฐ

แบบที่สาม The History (ประวัติศาสตร์) เปรียบเทียบแพ็คเกจเงินอุ้มครั้งนี้กับกรณีใช้จ่ายเงินมหาศาลของรัฐบาล


อเมริกันครั้งก่อนๆ ในประวัติศาสตร์ โดยปรับตัวเลขตามเงินเฟ้อเพื่อให้เปรียบเทียบค่าเงินข้ามหลายศตวรรษได้
อย่างถูกต้อง
แบบสุดท้าย The Value (มูลค่า) ค้านวณให้ดูว่าภาระเงินอุ้มของแต่ละครอบครัวจาก The Numbers นั้นซื้อ
สินค้าต่างๆ ที่คนอเมริกันชอบ (รถยนต์เชฟโรเล็ตรุ่น Aveo ค่าเล่าเรียนระดับอุดมศึกษา เครื่องไอแม็ค และ
แพ็คเกจเรือส้าราญ) ได้มากน้อยเพียงใด

นอกจากการเชื่อมมาใกล้ตัวด้วยการน้าเสนอเชิงเปรียบเทียบในทางที่ใกล้ตัว อีกวิธีที่น่าสนใจ โดยเฉพาะส้าหรับคน


ที่ถนัดกราฟฟิกมากกว่าตัวเลข คือการใช้ “ภาพ” สื่อสาร “ขนาด” อย่างชัดเจน

ตัวอย่างหนึ่งที่ลือลั่นคือเว็บไซต์ usdebt.kleptocracy.us/ ซึ่งแสดงขนาดของหนี้สาธารณะอเมริกาเป็นกองเงิน


เปรียบเทียบกับสถานที่ส้าคัญๆ ในอเมริกา ยกตัวอย่างเช่น เปรียบเทียบกับอนุสาวรีย์เทพีเสรีภาพ ตึกเอ็มไพร์
สเตท และตึกเวิลด์ เทรด เซ็นเตอร์ ให้เห็นอย่างชัดเจนว่าใหญ่โตกว่ากันขนาดไหน (กองเงินแสดงหนี้สาธารณะ
114.5 ล้านล้านเหรียญสหรัฐ อยู่ทางขวาสุดของภาพ) –

หนี้สาธารณะอเมริกัน เปรียบเทียบกับสถานที่สาคัญ ที่มา: http://usdebt.kleptocracy.us/


โลกออนไลน์ไทยก็เริ่มมีตัวอย่างอินโฟกราฟฟิกที่พยายามเชื่อมข้อมูลมาใกล้ตัวเหมือนกัน ตัวอย่างหนึ่งที่ผู้เขียน
ค่อนข้างชอบมาจากเว็บ GeoThai.net ชื่อ “บันทึกประวัติศาสตร์โลก: เข้าใจธรณีกาลด้วยหนังสือหนึ่งเล่ม” –

บันทึกประวัติศาสตร์โลก: เข้าใจธรณีกาลด้วยหนังสือหนึ่งเล่ม ที่มา: http://geothai.net/gneiss/?p=20250

ค้าอธิบายใต้อินโฟกราฟฟิกชิ้นนี้ระบุอย่างชัดเจนว่า “เปรียบเทียบมาตราเวลาทางธรณีกาลกับหนังสือหนึ่งเล่ม ที่


ประกอบด้วยกระดาษ 100 แผ่น (100 หน้า) สารบัญแบ่งเป็น 11 บท ตามจ้านวนมหายุค (Era) ล้าดับจากอายุ
อ่อนไปอายุแก่ โดยมีปัจจุบันอยู่ในหน้าแรก ที่คั่นหนังสือระบุเหตุการณ์ส้าคัญที่เกิดขึ้นบนโลก”

ผู้เขียนหวังว่าตัวอย่างทั้งหมดที่ยกมาข้างต้นนั้นคงพอจะชี้ให้เห็นความส้าคัญของการหาวิธี “สื่อความหมาย” ของ


ข้อมูลให้ชัดเจน ตรงประเด็น และพยายามป้องกันความเข้าใจผิดที่อาจเกิดขึ้นกับผู้อ่าน
นั่นหมายความว่าผู้จัดท้าอินโฟกราฟฟิกจะต้องเข้าใจข้อมูลและวิเคราะห์ข้อมูลเป็น ไม่ใช่มัวแต่คิดเรื่องความ
สวยงามหรือความดูดีมีเอกลักษณ์ของดีไซน์ เพราะถึงที่สุดแล้ว ไม่ว่าดีไซน์จะเตะตาขนาดไหน ถ้าหากอินโฟ
กราฟฟิกชิ้นนั้นใช้ข้อมูลไม่ถูกต้อง ไม่มีประเด็นชัดเจน และไม่ได้สื่อสาร “เรื่องราว” อะไรที่น่าสนใจ มันก็ไม่ต่าง
อะไรกับหนังสือที่ดูดีแค่ปกเท่านั้น

อย่าตายน้้าตื้นกับสถิติ
ในช่วงสุดท้าย ผู้เขียนอยากพูดถึง “กับดักทางสถิติ” ที่พบเห็นบ่อยแต่ไม่ค่อยมีใครฉุกคิดว่าติดกับดัก รวมทั้งตัวคน
ที่ออกแบบอินโฟกราฟฟิกเองด้วย โชคดีที่ไปเจอเว็บ School of Data ซึ่งมีชุดบทความอ่านง่ายเกี่ยวกับการท้า
ความเข้าใจและจัดการกับข้อมูล รวมถึงบทความเกี่ยวกับความเข้าใจผิดเกี่ยวกับสถิติ ผู้เขียนจึงถือวิสาสะแปลเป็น
ภาษาไทยเพื่อเผยแพร่โดยทั่วกัน

ระวัง! ความเข้าใจผิดพบบ่อยและวิธีหลีกเลี่ยง
แปลจาก Look Out! Common Misconceptions and How to Avoid Them, เว็บไซต์ School of Data

คุณเคยได้ยินค้ากล่าวยอดฮิต “การโกหกมีอยู่สามแบบ – ค้าโกหก โคตรโกหก และสถิติ” หรือเปล่า? ประโยคนี้


สะท้อนความไม่ไว้วางใจของคนทั่วไปต่อข้อมูลที่เป็นตัวเลขและวิธีแสดงข้อมูล ซึ่งความไม่ไว้ใจนี้ก็มีมูลความจริงไม่
น้อย เพราะนานเกินไปแล้วที่การแสดงข้อมูลตัวเลขในรูปกราฟถูกใช้บิดเบือน “ข้อเท็จจริง” ให้คนเข้าใจผิด
ค้าอธิบายต่อเรื่องนี้คือ ข้อมูลทั้งหมดล้วนอยู่ในข้อมูลดิบ แต่ก่อนที่เราจะประมวลผลข้อมูลดิบ มันก็ ‘เยอะ’ เกิน
กว่าที่สมองของเราจะเข้าใจได้

การค้านวณหรือการแสดงข้อมูลเป็นภาพ (visualization) ใดๆ ก็ตาม ไม่ว่าจะง่ายดายอย่างการค้านวณค่าเฉลี่ย


หรือซับซ้อนอย่างการแสดงกราฟสามมิติ ล้วนตั้งอยู่บนการยอม “สูญเสีย” ข้อมูลบางส่วนไป เพื่อให้เราท้าความ
เข้าใจกับมันได้ ความผิดพลาดส่วนใหญ่เกิดขึ้นเวลาที่คนทิ้งข้อมูลส่วนที่ส้าคัญจริงๆ ไป หรือไม่ก็พยายามอธิบาย
ข้อมูลทั้งชุดด้วยประโยคใหญ่ๆ ที่ฟังดูครอบจักรวาล โดยมากสิ่งที่พวกเขาบอกเรามักจะ “จริง แต่ไม่ได้บอก
เรื่องราวทั้งหมด”

วันนี้เราจะมาดูความเข้าใจผิดและกับดักทางความคิดที่พบบ่อยเวลาที่คนเริ่มวิเคราะห์ข้อมูลเพื่อแสดงด้วยภาพ
คุณจะหลีกเลี่ยงความผิดพลาดในงานของคุณ และไม่ตกหลุมพรางในงานของคนอื่น ก็ต่อเมื่อคุณรู้ว่าความ
ผิดพลาดเหล่านั้นมีอะไรบ้าง
กับดักค่าเฉลี่ย

คุณเคยเจอประโยคอย่าง “ชาวยุโรปเฉลี่ยดื่มเบียร์ 1 ลิตรต่อวัน” หรือเปล่า? คุณถามตัวเองไหมว่า “ชาวยุโรป


เฉลี่ย” ผู้ลึกลับคนนี้เป็นใคร และคุณจะเจอเขาได้ที่ไหน? ข่าวร้ายคือไม่มีวันเจอ เพราะเขาหรือเธอไม่มีอยู่จริง ใน
บางประเทศคนดื่มไวน์มากกว่าเบียร์ แล้วคนที่ไม่ดื่มเหล้าเลยล่ะ? เด็กๆ ล่ะ? พวกเขาดื่มเบียร์วันละ 1 ลิตรด้วย
หรือเปล่า? ชัดเจนว่าประโยคนี้ชี้ชวนให้เข้าใจผิด แล้วตัวเลขนี้มาจากไหนกัน?

คนที่อ้างอะไรๆ ท้านองนี้มักจะตั้งต้นจากตัวเลขใหญ่ๆ บางตัว เช่น ทุกปีชาวยุโรปทั้งทวีปดื่มเบียร์รวมกัน


109,000 ล้านลิตร เสร็จแล้วพวกเขาก็เอาตัวเลขนี้มาหารด้วยจ้านวนวันในหนึ่งปีและจ้านวนประชากรของยุโรป
เสร็จแล้วก็ป่าวร้องข่าวน่าตื่นเต้น ถ้าเราเอางบประมาณด้านสาธารณสุขมาหารด้วยประชากร ผลที่ได้ก็ออกมา
ท้านองเดียวกัน มันแปลว่าคนทุกคนใช้เงินเท่านี้หรือเปล่า? เปล่าเลย มันแปลว่าบางคนใช้มากกว่า บางคนใช้น้อย
กว่า สิ่งที่เราท้าคือการหา ค่าเฉลี่ย ซึ่งบอกอะไรๆ ได้ดีมาก – ถ้าหากข้อมูลกระจายตัวแบบปกติ “การกระจายตัว
แบบปกติ” (normal distribution) หมายถึงเส้นโค้งความถี่รูประฆังคว่้า
การกระจายตัวแบบปกติ
ภาพด้านบนแสดงการกระจายตัวแบบปกติสามชุด (แสดงด้วยเส้นสามเส้น) ทุกชุดมี ค่าเฉลี่ย เท่ากัน แต่ก็ชัดเจนว่า
มันไม่เหมือนกัน สิ่งที่ค่าเฉลี่ยบอกคุณไม่ได้คือ ขอบเขตของข้อมูล

ข้อมูลส่วนใหญ่ที่เราเจอไม่ได้กระจายตัวแบบปกติ ตัวอย่างหนึ่งคือรายได้ ตัวเลขรายได้เฉลี่ย (สิ่งที่สื่อมักจะชอบ


รายงาน) จะท้าให้คิดว่าคนครึ่งหนึ่งมีรายได้มากกว่าค่านี้ อีกครึ่งหนึ่งน้อยกว่าค่านี้ แต่ความคิดนี้ผิด ในประเทศ
ส่วนใหญ่ คนที่มีรายได้น้อยกว่าค่าเฉลี่ยมีจ้านวนมากกว่าคนที่มีรายได้สูงกว่าค่าเฉลี่ยหลายเท่า ยังไงล่ะ? ก็
เพราะว่ารายได้ไม่ได้กระจายตัวแบบปกติ มันพุ่งถึงจุดสูงสุด ณ จุดหนึ่ง (คือครัวเรือนจ้านวนมากที่สุดมีรายได้
ระดับนี้) แล้วทิ้งหางยาวไปทางรายได้สูงๆ

การกระจายรายได้ในสหรัฐอเมริกา
กราฟด้านบนแสดงการกระจายตัวของรายได้ในสหรัฐอเมริกา จากส้ามะโนประชากรปี 2011 ส้าหรับครัวเรือนที่มี
รายได้แต่ละระดับ สูงสุดที่ 200,000 เหรียญสหรัฐ คุณจะเห็นว่าครัวเรือนส่วนใหญ่มีรายได้ระหว่าง 15,000-
65,000 เหรียญสหรัฐ แต่เรามีหางยาวซึ่งดึงค่าเฉลี่ยให้เบ้ขึ้น

ถ้าหากรายได้เฉลี่ยปรับตัวสูงขึ้น มันก็อาจเป็นเพราะคนส่วนใหญ่มีรายได้เพิ่มขึ้น แต่มันก็อาจเกิดจากการที่คนใน


กลุ่มรายได้สูงสุดมีรายได้เพิ่มมหาศาลเช่นกัน – ทั้งสองกรณีนี้จะดันค่าเฉลี่ยขึ้น
ทดสอบ: ถ้าคุณอยากลองคิดเรื่องนี้กับตัวเลข ลองท้าบททดสอบสั้นๆ นี้ดู:

นึกถึงคน 10 คน คนแรกได้เงินเดือน 1 บาท คนที่สองได้ 2 บาท คนที่สามได้ 3 บาท …ไปเรื่อยๆ ถึงคนสุดท้ายได้


10 บาท ลองค้านวณเงินเดือนเฉลี่ยดู

ทีนี้เพิ่มเงินให้ทุกคนคนละ 1 บาท (เป็น 2 บาท, 3 บาท, 4 บาท… ถึง 11 บาท) ค่าเฉลี่ยใหม่เท่ากับเท่าไหร่?

คราวนี้กลับไปที่เงินเดือนตั้งต้น (1 บาท, 2 บาท, 3 บาท ฯลฯ) แล้วบวก 10 บาทให้กับคนที่ได้เงินเดือนสูงสุด (จะ


ได้ 1 บาท, 2 บาท, 3 บาท, …. 9 บาท และ 20 บาท) คราวนี้ค่าเฉลี่ยเท่ากับเท่าไหร่?

นักเศรษฐศาสตร์ตระหนักในประเด็นนี้ พวกเขาเลยเพิ่มตัววัดเข้ามา “ค่าสัมประสิทธิ์จีนี่” (Gini coefficient) บอก


คุณเกี่ยวกับการกระจายตัวของรายได้ วิธีค้านวณค่านี้ซับซ้อนเล็กน้อยและอยู่นอกเหนือบทความชิ้นนี้ อย่างไรก็ดี
คุณก็ควรรู้ว่ามีตัววัดแบบนี้อยู่ เราสูญเสียข้อมูลมหาศาลไปเวลาที่ค้านวณแต่ค่าเฉลี่ย นึกถึงเรื่องนี้ให้มากเวลาที่คุณ
อ่านข่าวและเนื้อหาออนไลน์

ทดสอบ: คุณมองเห็นตัวอย่างอื่นอีกไหมที่การใช้ค่าเฉลี่ยมีปัญหา?

มากกว่าแค่ค่าเฉลี่ย…

แล้วถ้าเราไม่ใช้ ค่าเฉลี่ย เราควรใช้อะไรดี? มีตัววัดอื่นๆ อีกมากมายที่สามารถสร้างบริบทเพิ่มเติมให้ตัวเลขค่าเฉลี่ย


มีความหมายมากกว่าเดิมได้ ยกตัวอย่างเช่น

• แสดงค่าเฉลี่ยพร้อมกับขอบเขตข้อมูลด้วย เช่น บอกว่าข้อมูลชุดนี้มีค่า 20-5,000 และมีค่าเฉลี่ยเท่ากับ


50 ลองนึกถึงตัวอย่างเบียร์ของเราก็ได้ – จะดีกว่าเดิมเล็กน้อยถ้าคุณบอกว่าชาวยุโรปดื่มเบียร์ระหว่าง 0-
5 ลิตรต่อวัน เฉลี่ยคนละ 1 ลิตรต่อวัน
• ใช้ ค่ามัธยฐาน: ค่ามัธยฐานคือมูลค่าที่อยู่ตรงกลางพอดี คือมี 50% ที่อยู่สูงกว่าและอีก 50% อยู่ต่้ากว่า
รายได้มัธยฐานหมายถึงรายได้ที่คนจ้านวน 50% มีรายได้น้อยกว่าค่านี้ คนที่เหลืออีก 50% มีรายได้สูง
กว่าค่านี้
• ใช้ ค่าควอไทล์ หรือ เปอร์เซ็นต์ไทล์: ควอไทล์ (quartile) เหมือนกับค่ามัธยฐานแต่ใช้ส้าหรับระดับ 25
เปอร์เซ็นต์, 50 เปอร์เซ็นต์ และ 75 เปอร์เซ็นต์ เปอร์เซ็นต์ไทล์ (percentile) ก็เหมือนกันแต่ใช้ส้าหรับ
ช่วงอื่นที่ไม่ใช่ทุกๆ เศษหนึ่งส่วนสี่ (ปกติทีละ 10 เปอร์เซ็นต์) ค่าเหล่านี้ให้ข้อมูลเรามากกว่าค่าเฉลี่ยมาก
นอกจากนั้นยังบอกเราเกี่ยวกับการกระจายตัวของข้อมูลด้วย (เช่น คน 1 เปอร์เซ็นต์ที่รวยที่สุด
ครอบครองความมั่งคั่ง 80 เปอร์เซ็นต์ของทั้งประเทศจริงๆ หรือเปล่า?)
ขนาดนั้นสาคัญไฉน

ขนาดนั้นส้าคัญจริงๆ ในการแสดงข้อมูลด้วยภาพ ลองเปรียบเทียบกราฟแท่งสองกราฟต่อไปนี้

ค่าใช้จ่ายด้านสุขภาพของฟินแลนด์
ลองนึกถึงพาดหัวของกราฟสองกราฟนี้ พาดหัวส้าหรับกราฟทางซ้ายอาจเขียนว่า “ค่าใช้จ่ายด้านสุขภาพใน
ฟินแลนด์พุ่งฉุดไม่อยู่!” ส่วนกราฟทางด้านขวาอาจอยู่ใต้พาดหัว “ค่าใช้จ่ายด้านสุขภาพในฟินแลนด์ค่อนข้างทรง
ตัว” ทีนี้ลองดูข้อมูล มันคือข้อมูลชุดเดียวกันแต่น้าเสนอเป็นสองวิธี (ที่ไม่ถูกทั้งคู่)

ทดสอบ: คุณมองเห็นไหมว่ากราฟข้างต้นท้าให้คนเข้าใจผิดอย่างไร?
ก่อนอื่น ข้อมูลในกราฟทางด้านซ้ายไม่ได้เริ่มที่ 0 เหรียญสหรัฐ แต่เริ่มที่ประมาณ 3,000 เหรียญสหรัฐ ท้าให้ความ
แตกต่างระหว่างแท่งดูใหญ่กว่าความเป็นจริง เช่น ค่าใช้จ่ายระหว่างปี 2001 กับ 2002 ดูเหมือนจะเพิ่มขึ้นอย่าง
น้อยสามเท่า! ทั้งที่ความจริงไม่ใช่เลย นอกจากนี้ การเลือกแกนตั้งและแกนนอนให้มีความยาวเท่ากัน (ท้าให้กราฟ
อยู่ในกรอบสี่เหลี่ยมจัตุรัส) ก็ช่วยขับเน้นความแตกต่างให้ดูหวือหวาเข้าไปอีก

กราฟทางด้านขวาเริ่มต้นที่ 0 เหรียญสหรัฐ แต่ลากหน่วยในแกนตั้งขึ้นไปถึง 30,000 เหรียญสหรัฐ ทั้งที่ค่าสูงสุดใน


ชุดข้อมูลอยู่ที่ 9,000 เหรียญสหรัฐเท่านั้น กราฟนี้ เที่ยงตรงกว่า กราฟทางซ้ายมือ แต่ก็ยังท้าให้สับสนอยู่ดี ไม่น่า
แปลกใจว่าท้าไมคนที่คุ้นเคยกับการหลอกลวงคนอื่นด้วยข้อมูลถึงได้คิดว่าสถิติคือเรื่องโกหก

ตัวอย่างนี้ชี้ให้เห็นว่าการแสดงข้อมูลของคุณด้วยภาพนั้นส้าคัญเพียงใดที่จะต้องถูกต้อง ต่อไปนี้เป็นกฎง่ายๆ บาง


ข้อ –
• เลือกขอบเขตที่เหมาะสมกับข้อมูลของคุณเสมอ
• ระบุขอบเขตอย่างถูกต้องบนแกน!
• ความเปลี่ยนแปลงของขนาดที่เรามองเห็นในกราฟควรสะท้อนความเปลี่ยนแปลงของขนาดในข้อมูล
ของคุณ ฉะนั้นถ้าหากข้อมูลของคุณแสดงว่า B มีค่าเท่ากับสองเท่าของ A ขนาดของ B ก็ควรใหญ่
เป็นสองเท่าของ A ในภาพ

กฎ “แสดงขนาดให้ถูกต้อง” นั้นยากกว่าเดิมเวลาวาดภาพสองมิติ (คือไม่ใช่กราฟเส้น ซึ่งมีหนึ่งมิติ) เมื่อคุณต้อง


ค้านึงถึงพื้นที่รวม เมื่อไหร่ก็ไม่รู้ที่ส้านักข่าวต่างๆ เริ่มเลิกใช้กราฟแท่ง เปลี่ยนมาใช้ภาพสองมิติแต่ยังขยายขนาด
(scale) ของภาพด้วยวิธีเดิม ปัญหาน่ะหรือ? ถ้าคุณปรับความสูงของรูปให้สะท้อนความเปลี่ยนแปลงและความ
กว้างของมันก็ขยายขึ้นด้วยโดยอัตโนมัติ พื้นที่ก็จะขยายเพิ่มยิ่งกว่าเดิมและท้าให้ข้อมูลผิดถนัด! งงไหม? ลองดูฟอง
สบู่ด้านล่างนี้

A กับ B
ทดสอบ: เราอยากแสดงว่า B มีขนาดเป็นสองเท่าของ A ภาพไหนที่ถูกต้อง? เพราะอะไร?
ค้าตอบ: ภาพทางขวามือ

ลืมหรือยังว่าสูตรการค้านวณพื้นที่ของวงกลมคืออะไร? (พื้นที่ = πr² ถ้าหากคุณไม่คุ้นเลย ลองดูหน้านี้) ในภาพ


ทางซ้าย รัศมีของวงกลม A ถูกขยายขึ้นสองเท่า นั่นหมายความว่าพื้นที่รวมใหญ่ขึ้นถึงสี่เท่า! นี่คือการแสดงข้อมูลที่
ผิด ถ้าวงกลม B จะแสดงตัวเลขที่ใหญ่เป็นสองเท่าของ A เราก็ต้องค้านวณให้พื้นที่ B ใหญ่เป็นสองเท่าของพื้นที่ A
ซึ่งแปลว่าเราต้องลดความยาวของรัศมีลง √2 เพื่อแสดงความแตกต่างของขนาดที่ถูกต้อง
เวลาจะบอกได้?

เส้นเวลามักจะขาดไม่ได้เวลาแสดงข้อมูล ลองดูกราฟต่อไปนี้

ดูเหมือนค่าใช้จ่ายด้านสุขภาพจะเพิ่มขึ้นอย่างคงที่ต่อเนื่องตั้งแต่ปี 2002 ใช่ไหม? ไม่เชิง ลองสังเกตว่าก่อนปี 2004


แกนนอนแสดงข้อมูลทีละ 1 ปี แต่หลังจากนั้นมีช่องว่างระหว่างปี 2004 กับ 2007 และจาก 2007 ก็กระโดดไป
2009 การแสดงข้อมูลแบบนี้ท้าให้เราเชื่อว่าค่าใช้จ่ายด้านสุขภาพเพิ่มขึ้นอย่างต่อเนื่องในอัตราการเติบโตคงที่
ตั้งแต่ปี 2002 ทั้งที่ความจริงไม่ใช่ ฉะนั้นถ้าคุณแสดงเส้นเวลา คุณก็ควรจะมั่นใจว่าช่องห่างระหว่างจุดข้อมูลต่างๆ
นั้นถูกต้อง! ไม่อย่างนั้นคุณจะไม่มีวันมองเห็นแนวโน้มที่แท้จริงได้เลย

“ความเชื่อมโยง” (correlation) ไม่ใช่ “ความเป็นเหตุเป็นผล” (causation)

ความเข้าใจผิดว่า ความเชื่อมโยงหรือภาษาสถิติ “สหสัมพันธ์” (correlation หมายถึงชุดข้อมูลสองชุดที่เดินทาง


เดียวกัน หรือเดินสวนทางกัน) แสดงความสัมพันธ์แบบเป็นเหตุเป็นผลกันนั้นแพร่หลายเสียจนในวิกิพีเดียมี
บทความอธิบายเรื่องนี้โดยเฉพาะ เราคงไม่มีอะไรจะเพิ่มเติมในที่นี้ สรุปสั้นๆ คือ ล้าพังการที่ข้อมูลสองจุดแสดง
การเปลี่ยนแปลงที่อาจมีความสัมพันธ์กัน ไม่ได้แปลว่าจุดหนึ่งก่อให้เกิดอีกจุดหนึ่ง (ยกตัวอย่างเช่น ถ้ากบร้องทุก
ครั้งที่ฝนตก แปลว่า “ฝนตก” อาจสัมพันธ์กับ “กบร้อง” แต่ล้าพังข้อมูลนี้ไม่ได้แปลว่า “กบร้อง” ท้าให้ “ฝนตก”)
บริบท, บริบท, บริบท

ประเด็นหนึ่งทีส่ ้าคัญยิ่งส้าหรับข้อมูลคือบริบทของข้อมูล ตัวเลขหรือคุณภาพไม่มีความหมายใดๆ เลยถ้าหากคุณไม่


อธิบายบริบท ดังนั้นคุณถึงต้องอธิบายว่าก้าลังแสดงอะไรอยู่ อธิบายว่าคุณอ่านข้อมูลอย่างไร อธิบายว่าข้อมูลมา
จากไหน และอธิบายว่าคุณท้าอะไรกับมัน ถ้าคุณมอบบริบทที่เหมาะสม บทสรุปก็ควรจะ ‘กระโดด’ ออกมาจาก
ข้อมูลนั้นเอง

เปอร์เซ็นต์ กับ จุด (percentage point) ที่เปลี่ยนแปลง

ข้อนี้เป็นกับดักส้าหรับเราหลายคน ถ้าหากตัวเลขเปลี่ยนแปลงจาก 5 เปอร์เซ็นต์ เป็น 10 เปอร์เซ็นต์ การ


เปลี่ยนแปลงนี้คิดเป็นกี่เปอร์เซ็นต์?

ถ้าคุณตอบว่า 5 เปอร์เซ็นต์ เสียใจด้วยนะ! ค้าตอบคือ 100 เปอร์เซ็นต์ (10 เปอร์เซ็นต์ เท่ากับ 200 เปอร์เซ็นต์
ของ 5 เปอร์เซ็นต์) หรือเปลี่ยนไป 5 จุด ดังนั้นก็ระวังให้ดีในคราวต่อไปที่คุณเห็นคนรายงานผลการเลือกตั้ง ผลการ
ส้ารวจความคิดเห็นและอื่นๆ ท้านองนี้ คุณจะมองเห็นข้อผิดพลาดของพวกเขาหรือไม่?

อยากทบทวนวิธีค้านวณเปอร์เซ็นต์ที่เปลี่ยนแปลงหรือเปล่า? ลองดู หน้านี้ของเว็บ Math is Fun

จับขโมย – ความอ่อนไหวกับตัวเลขใหญ่ๆ

ลองนึกดูว่าคุณเป็นเจ้าของร้านค้า เพิ่งติดตั้งระบบสัญญาณกันขโมย ระบบนี้สามารถเตือนภัยด้วยอัตราความ


เที่ยงตรงถึง 99 เปอร์เซ็นต์ วันหนึ่งสัญญาณดังขึ้นมา มีความเป็นไปได้เท่าไรที่คนที่เดินผ่านระบบนี้จะเป็นขโมย?

คุณอาจจะอยากตอบว่ามีความเป็นไปได้ 99 เปอร์เซ็นต์ที่คนคนนั้นขโมยอะไรสักอย่างในร้าน แต่ความจริงอาจไม่


เป็นอย่างนัน้ ก็ได้

ในร้านของคุณมีทั้งลูกค้าที่ซื่อสัตย์กับหัวขโมย แต่ลูกค้าที่ซื่อสัตย์มีจ้านวนมากกว่าหัวขโมยมาก – มีลูกค้าที่ซื่อสัตย์


10,000 คน และมีหัวขโมยเพียงคนเดียว ถ้าหากคนทุกคนเดินผ่านระบบเตือนภัยของคุณ สัญญาณจะดัง 101 ครั้ง
1 เปอร์เซ็นต์ของเวลาที่ดังมันจะชี้คนผิด คือดังเวลาลูกค้าดีเดินผ่าน ดังนั้นมันจะดังอย่างถูกต้อง 100 ครั้ง ระบบ
จะบอกอย่างถูกต้องว่าหัวขโมยคือหัวขโมย 99 เปอร์เซ็นต์ของเวลาดัง ฉะนั้นมันจึงน่าจะดังหนึ่งครั้งเวลาที่ขโมยตัว
จริงเดินผ่าน แต่จากจ้านวนครั้งทั้งหมด 101 ครั้งที่สัญญาณดัง จะมีเพียง 1 ครัง้ เท่านั้นที่มีหัวขโมยอยู่ในร้านคุณ
จริงๆ ดังนั้นความเป็นไปได้ที่คนคนนั้นจะเป็น ขโมยตัวจริง เวลาสัญญาณดังจึงไม่ถึง 1 เปอร์เซ็นต์ (จริงๆ คือ 1 /
101 = 0.99 เปอร์เซ็นต์)

การประเมินความเป็นไปได้สูงเกินไปในกรณีที่เหตุการณ์อะไรสักอย่างถูกรายงานว่าเกิดจริงแบบนี้มีชื่อเรียกว่า
“ตรรกะวิบัติเรื่องอัตราฐาน” (base rate fallacy) ซึ่งเป็นค้าอธิบายว่าท้าไมการค้นตัวที่สนามบินและวิธีคัดกรอง
คนอื่นๆ จึงทึกทักว่าผู้โดยสารจ้านวนมากเป็นผู้ก่อการร้าย (false positive)

สรุป

ในส่วนนี้เราทบทวนความผิดพลาดที่พบบ่อยบางประการเวลาน้าเสนอข้อมูล ไม่ว่าจะใช้ข้อมูลเป็นเครื่องมือเล่า
เรื่องราว หรือสื่อสารประเด็นและข้อค้นพบของเรา ถึงแม้เราจะต้อง “ย่อย” ข้อมูลให้เข้าใจง่ายว่าข้อมูลแปลว่า
อะไร การย่อยอย่างผิดๆ ก็อาจท้าให้คนเข้าใจผิด เมื่อใดก็ตามที่คุณใช้ภาพแสดงหลักฐาน พยายามซื่อสัตย์กับ
ข้อมูลให้มากที่สุด ถ้าเป็นไปได้ก็อย่าเผยแพร่เฉพาะผลการวิเคราะห์ของคุณอย่างเดียว แต่จงปล่อยข้อมูลดิบ
ออกมาพร้อมกันเลย!

—–

ผู้เขียนขอจบการน้าเสนอซีรีส์สั้น “อินโฟกราฟฟิกที่ดี” แต่เพียงเท่านี้ อย่าลืมว่า ข้อมูลคือหัวใจ แต่ต้องใช้กราฟให้


เป็น, สื่อให้เห็นความหมาย และอย่าตายน้้าตื้นกับสถิติ!

Rate