สถิติและข้อมูล การแจกแจงความถี่ของข้อมูล

ยอดวิว 0

แบบฝึกหัด

EASY

สถิติและข้อมูล การแจกแจงความถี่ของข้อมูล

MEDIUM

สถิติและข้อมูล การแจกแจงความถี่ของข้อมูล

HARD

สถิติและข้อมูล การแจกแจงความถี่ของข้อมูล

เนื้อหา

สถิติ ข้อมูล และการแจกแจงความถี่ของข้อมูล

คำว่า “สถิติและข้อมูล” แยกออกได้เป็น 2 คำ คือ สถิติ ตรงกับภาษาอังกฤษ Statistics กับ ข้อมูล ตรงกับคำภาษาอังกฤษ Data ซึ่งมีการให้ความหมายสองคำนี้ไว้หลายประเด็นด้วยกัน ดังนี้

สถิติ

  • สถิติ หมายถึง ข้อมูลที่แสดงข้อเท็จจริงเกี่ยวกับเรื่องใดเรื่องหนึ่งหรือหลายเรื่อง แบ่งเป็น 2 ประเภท คือ
    (1) สถิติพรรณนา (Descriptive statistics) (2) สถิติอนุมาน (Inferential statistics)
  • สถิติ หมายถึง ศาสตร์ที่ว่าด้วยหลักการของระเบียบวิธีทางสถิติที่มีทฤษฎีความน่าจะเป็นเข้ามาเกี่ยวข้องในการสรุปผลข้อมูล อันประกอบด้วย (1) การเก็บรวบรวมข้อมูล (Data collection) (2) การนำเสนอข้อมูล (Presentation) (3) การวิเคราะห์ข้อมูล (Data analysis) (4) การแปลผล (Interpretation) และ (5) การสรุปผล (Conclusion)

จากความหมายของสถิติที่กล่าวมาทำให้ทราบว่าสถิติและข้อมูลมีความสัมพันธ์กัน ดังนั้น เราควรมาดูความหมายของคำว่าข้อมูลควบคู่ไปพร้อมกัน

ข้อมูล

  • ข้อมูล หมายถึง สารสนเทศของเรื่องใดเรื่องหนึ่งหรือหลายเรื่องพร้อมกัน ซึ่งสารสนเทศทางสถิติก็คือ ตัวเลข ตัวอักษร รูปภาพ วิดีโอ เสียงบันทึกจากการทดลอง รหัส สัญลักษณ์ แผนภูมิ กราฟ ตาราง ค่าของตัวแปร อิทธิพล ปัจจัย หรือข้อสรุปต่างๆ ที่เกิดขึ้นจากการสังเกต การทดลอง และการวิจัย เป็นต้น แบ่งได้เป็น 2 ประเภทใหญ่ๆตามแหล่งที่มาของข้อมูล คือ (1) ข้อมูลปฐมภูมิ (primary data) (2) ข้อมูลทุติยภูมิ (secondary data)
หมายเหตุ ในการศึกษารายละเอียดของสถิติและข้อมูลจะมีคำศัพท์ที่สำคัญเข้ามาเกี่ยวข้องอีก เช่น ประชากร ตัวอย่าง ตัวแปรุ่ม การสุ่มตัวอย่าง สเกลของการวัด การวิเคราะห์เชิงคุณภาพ และการเชิงปริมาณ เป็นต้น

การแจกแจงความถี่

การแจกแจงความถี่ เป็นวิธีหนึ่งของสถิติพรรณา ใช้ในการจัดการข้อมูลที่เก็บรวบรวมมาเป็นจำนวนมากให้เป็นพวก ๆ เพื่อความสะดวกในการนำเสนอข้อมูลและวิเคราะห์ข้อมูล โดยจะนำข้อมูลที่เป็นค่าของตัวแปรที่สนใจมาจัดเรียงตามลำดับความมากน้อย แล้วนับจำนวนข้อมูลในแต่ละค่าของตัวแปร ในส่วนการนำเสนอข้อมูลโดยการแจกแจงความถี่นั้นสามารถแบ่งการนำเสนอได้ 2 รูปแบบ ดังนี้

การแจกแจงความถี่ด้วยตาราง

การแจกแจงความถี่ด้วยตาราง สามารถแบ่งย่อยได้เป็น 2 แบบ คือ

  • ตารางแจกแจงความถี่ของลักษณะที่สนใจที่เป็นไปได้ทั้งหมด ซึ่งจะเหมาะกับข้อมูลที่มีจำนวนลักษณะที่เป็นไปได้ทั้งหมดไม่มากนัก เช่น จำแนกตามเพศ คือ ชาย หญิง จำแนกตามระดับการศึกษา เป็นต้น
  • ตารางแจกแจงความถี่สำหรับค่าในแต่ละช่วงของลักษณะที่สนใจ ซึ่งจะเหมาะกับข้อมูลที่มีจำนวนลักษณะที่เป็นไปได้ทั้งหมดจำนวนมาก เช่น น้ำหนักของนักเรียนทั้งโรงเรียน คะแนนสอบ O-NET ของนักเรียนชั้น ม.6 เป็นต้น การแจกแจงความถี่แบบนี้จะแบ่งข้อมูลทั้งหมดออกเป็นช่วง ๆ ที่ต่อเนื่องกัน โดยแต่ละช่วงประกอบด้วยข้อมูลหลาย ๆ ค่า ทำให้ลดจำนวนค่าที่เป็นไปได้ทั้งหมดลงไปได้ ซึ่งจะเรียกช่วงเหล่านี้ว่า อันตรภาคชั้น (class Interval) หรือเรียกสั้น ๆ ว่า ชั้น ดังตัวอย่างที่ 1
    ขั้นตอนการสร้างตารางแจกแจงความถี่   
1. หาค่าพิสัยของข้อมูล
(range: R) = ค่าสูงสุด – ค่าต่ำสุด
2. กำหนดจำนวนชั้น (K) =  1+3.3 log N
3. คำนวณหาความกว้างของชั้น (interval: ) =  R over K   
4. คำนวณหาขีดจำกัด (class boundary)

ขีดจำกัดล่าง (lower boundary) ของอันตรภาคชั้น หมายถึง ค่ากึ่งกลางระหว่างค่าที่น้อยที่สุดของอันตรภาคชั้นนั้นกับค่าที่มากที่สุดของอันตรภาคชั้นที่ต่ำกว่าหนึ่งชั้น หรือขอบล่างเท่ากับค่าที่น้อยที่สุดของอันตรภาคชั้นบวกกับค่าที่มากที่สุดของอันตรภาคชั้นที่ต่ำกว่าหนึ่งชั้นแล้วหารด้วย 2

ขีดจำกัดบน (upper boundary) ของอันตรภาคชั้น หมายถึง ค่ากึ่งกลางระหว่างค่าที่มากที่สุดของอันตรภาคชั้นนั้นกับค่าที่น้อยที่สุดของอันตรภาคชั้นที่สูงกว่าหนึ่งชั้น หรือขอบบนเท่ากับค่าที่มากที่สุดของอันตรภาคชั้นนั้นบวกกับค่าที่น้อยที่สุดของอันตรภาคชั้นที่สูงกว่าหนึ่งชั้น แล้วหารด้วย 2 จะเห็นว่า ขอบบนของอันตรภาคชั้นหนึ่งย่อมเท่ากับขอบล่างของอันตรภาคชั้นที่สูงกว่าหนึ่งชั้นเสมอ
5. คำนวณจุดกึ่งกลางของแต่ละชั้น (midpoint)fraction numerator ข ี ดจำก ั ดบน plus ข ี ดจำก ั ดล ่ าง over denominator 2 end fraction
6. นับจำนวนค่าของข้อมูล (ความถี่: frequency) ในแต่ละชั้น

ความถี่สะสม (cumulative frequency)
ของค่าที่เป็นไปได้ค่าใด หรือของช่วงชั้นใด คือผลรวมของความถี่ของค่านั้นหรือช่วงชั้นนั้นกับความถี่ของค่าหรือช่วงชั้นที่ต่ำกว่าทั้งหมด หรือสูงกว่าทั้งหมดอย่างใดอย่างหนึ่ง (นิยมใช้ความถี่สะสมแบบต่ำกว่า)  
ความถี่สัมพัทธ์ (relative frequency) ของค่าที่เป็นไปได้ค่าใด หรือของช่วงชั้นใด คืออัตราส่วนระหว่างความถี่ของค่านั้นหรือช่วงชั้นนั้นกับผลรวมความถี่ทั้งหมด ซึ่งมักจะแสดงในรูปทศนิยม  ค่าความถี่สัมพัทธ์จะมีค่าอยู่ระหว่าง 0 ถึง 1 ผลรวมของความถี่สัมพัทธ์ทุกชั้นเท่ากับ 1 และเมื่อคูณด้วยร้อยจะเรียกว่าเปอร์เซ็นต์หรือร้อยละ
ความถี่สะสมสัมพัทธ์ (relative cumulative frequency) ของค่าที่เป็นไปได้ค่าใด หรือของช่วงชั้นใด คือ อัตราส่วนระหว่างความถี่สะสมของค่านั้นหรือช่วงชั้นนั้นกับผลรวมความถี่ทั้งหมด  และเมื่อคูณด้วยร้อยจะเรียกว่าเปอร์เซ็นต์หรือร้อยละ


ตัวอย่างที่ 1 ตารางแจกแจงความถี่สำหรับค่าคะแนนสอบในแต่ละช่วงของลักษณะที่สนใจ


begin mathsize 10px style คะแนน
space สอบ end style


begin mathsize 10px style รอยข ี ด
space คะแนน end style


begin mathsize 10px style ความถ ี่ space
space left parenthesis คน right parenthesis end style


begin mathsize 10px style ความถ ี่ space
สะสม space space
left parenthesis คน right parenthesis end style

begin mathsize 10px style ความถ ี่ space
ส ั มพ ั ทธ ์ end style

begin mathsize 10px style ร ้ อยละ end style

begin mathsize 9px style 1 minus 2 end style

//

begin mathsize 9px style 2 end style

begin mathsize 9px style 2 end style

begin mathsize 9px style 2 divided by 30
equals 0.07 end style

begin mathsize 9px style 0.07 x 100
equals 7 end style

begin mathsize 9px style 3 minus 4 end style

/////
/

begin mathsize 9px style 6 end style

begin mathsize 9px style 8 end style

begin mathsize 9px style 6 divided by 30
equals 0.2 end style

begin mathsize 9px style 0.2 space x 100
equals 20 end style

begin mathsize 9px style 5 minus 6 end style

/////
///// 
/

begin mathsize 9px style 11 end style

begin mathsize 9px style 19 end style

begin mathsize 9px style 11 divided by 30
equals 0.37 end style

begin mathsize 9px style 0.37 space x 100
equals 37 end style

begin mathsize 9px style 7 minus 8 end style

/////
//

begin mathsize 9px style 7 end style

begin mathsize 9px style 26 end style

begin mathsize 9px style 7 divided by 30
equals 0.23 end style

begin mathsize 9px style 0.23 space x 100
equals 23 end style

begin mathsize 9px style 9 minus 10 end style

////

begin mathsize 9px style 4 end style

begin mathsize 9px style 30 end style

begin mathsize 9px style 4 divided by 30
equals 0.13 end style

begin mathsize 9px style 0.13 space x 100
equals 13 end style

begin mathsize 9px style รวม end style


30


1

begin mathsize 12px style 100 end style



การแจกแจงความถี่ด้วยแผนภูมิรูปภาพ (Graphs)

การแจกแจงความถี่ด้วยแผนภูมิรูปภาพ (Graphs) เป็นการนำข้อมูลที่ถูกจัดกลุ่มและนับจำนวนซ้ำ (ความถี่) มานำเสนอในรูปของแผนภูมิรูปภาพ เพื่อให้เห็นภาพของข้อมูลที่สนใจจะศึกษาได้ชัดเจนมากขึ้น ซึ่งมักจะนำเสนอด้วยวิธีต่อไปนี้

  • ฮิสโทแกรม (Histograms) เป็นกราฟแสดงปริมาณของข้อมูลด้วยพื้นที่ที่สร้างขึ้นเป็นแท่งรูปสี่เหลี่ยมผืนผ้าติดต่อกันบนแกนนอน โดยมีแกนนอนแทนค่าที่เป็นไปได้ของตัวแปร ความกว้างของรูปสี่เหลี่ยมมุมฉากแทนความกว้างของอันตรภาคชั้น ส่วนความสูงของรูปสี่เหลี่ยมคือความถี่ของข้อมูล  ดังภาพที่ 1
  • แผนภาพต้น-ใบ (Stem-and-leaf plot หรือ stem plot) ใช้เพื่อจัดข้อมูลเป็นกลุ่ม ๆ และข้อมูลทุกตัวจะถูกแสดงในแผนภาพ ไม่เพียงแค่นับรวมว่าเป็นความถี่ในอันตรภาคชั้นเดียวกันเหมือนกับฮิสโทแกรม ดังภาพที่ 2

ภาพที่ 1
ฮิสโทแกรมคะแนนสอบ

ภาพที่ 2
แผนภาพต้น-ใบคะแนนสอบ