03 เมษายน 2552

Incidence and Prevalence

วันนี้ผมขอคั่นด้วยเรื่องง่ายๆ ที่หลายคนอาจจะยังไม่ทราบนะครับ คือเรื่องของ Incidence และ Prevalence เพราะหลายคนอาจจะสับสนกันบ่อยว่ามันคืออะไร ต่างกันยังไง

มาดูคำง่ายกันก่อน นั่นคือ Prevalence คำนี้ความหมายไม่ยากครับ มันก็คือสัดส่วนของคนที่เป็นโรคที่เราสนใจในคนทั้งหมดนั่นเอง หรือภาษาชาวบ้านก็คือ โรคนี้มันเป็นกันกี่ % เช่น เราบอกว่า ในคนไทยมี prevalence ของโรคเบาหวาน 20% ก็หมายความว่า ถ้า ณ วันนี้เอาคนไทยมา 100 คนแบบสุ่มๆ จะพบว่ามีคนเป็นเบาหวาน 20 คนนั่นเอง อันนี้คิดว่าทุกคนคงจะเข้าใจกันดีนะครับ ที่มาของตัวเลขนี้ส่วนมากก็เกิดจากการทำการศึกษาแบบ Cross-sectional นั่นเอง เช่น กระทรวงสาธารณสุขให้โรงพยาบาลทั้งประเทศรายงานจำนวนคนที่เมาในคนที่มารพ. เป็นต้นครับ

สังเกตุว่าเนื่องจากเป็น Cross-sectional มันก็จะเป็นที่ ณ จุดใดจุดหนึ่งของเวลา จึงไม่จำเป็นจะต้องเอาเวลามาเกี่ยวข้องกับการคิด หรือหน่วยเลยครับ ลองดูรูปภาพนี้นะครับ

prevalence

สังเกตว่า Prevalence ก็คือการตัดเอาที่จุดเวลา ถ้าผมเลือกว่าจุดเวลาของผมคือ 2003 ดังนั้นผมก็ไม่ต้องสนใจเวลาอื่น Prevalence ของคนสีแดง (ไม่เกี่ยวกับการเมืองนะ) = 3 ในคนทั้งหมด 7 คน หรือคิดเป็น 3/7 = 0.43 หรือ 43% นั่นเองครับ

ลองคิดดูนะครับว่าจากรูปดังกล่าว Prevalence ของคนสีแดงที่ปี 2005 เป็นเท่าไหร่

.

.

.

เฉลย คือ 3/7 เหมือนกันนะครับ

นอกจากคำว่า Prevalence ที่ใช้โดยทั่วไปแล้ว ยังมีคำว่า Point Prevalence, Prevalence Proportion, Prevalence Rate ซึ่งต่างก็หมายถึง Prevalence เหมือนกันทั้งหมดครับ (ดังนั้นก็จำคำว่า Prevalence อย่างเดียวก็น่าจะพอ)

ในทางกลับกัน คำว่า Incidence นั้นมีที่มาจากการศึกษาแบบ Cohort ดังนั้นจึงมีเวลาเข้ามาเกี่ยวข้อง โดยหมายถึง จำนวนเคส ใหม่ๆ ที่เกิดขึ้นในช่วงที่เราตามไปศึกษานั่นเอง ยกตัวอย่างรูปเดิมนะครับ

incidence

สังเกตุว่าเมื่อเราตามคนที่มีโอกาสเสี่ยงจะเป็นโรค (Population at risk -- ซึ่งแน่นอนคนที่เป็นโรคไปแล้วเราก็ไม่คิด) ไปเป็นระยะเวลา 20 คนปี เราจะเจอเคสใหม่ 2 เคส หรือเราอาจบอกว่าเจอ 2 เคสใน 20 คนปีก็ได้

ทำไมต้องเป็นหน่วย คนปี? เพราะว่ามันจะช่วยเราในการเอาไปเปรียบเทียบกับกลุ่มที่ศึกษาในจำนวนคนหรือปีต่างกันครับ เช่น แทนที่จะศึกษา 5 คนใช้เวลา 4 ปีแบบตัวอย่าง เราอาจจะศึกษา 10 คนในเวลา 2 ปี ก็ได้ 20 คนปีเหมือนกันเลย

ดังนั้น ตามคน 5 คนไป 4 ปี พบ 2 เคส ก็ = 2/20 = 0.1 Case/person-year
ตามคน 10 คนไป 2 ปี พบ 2 เคส ก็ = 2/20 = 0.1 Case/person-year
ตามคน 100 คนไป 0.2 ปี พบ 2 เคสก็ = 2/20 = 0.1 Case/person-year เหมือนกันหมด

เพราะฉะนั้นก็จะเห็นว่า มันจะมีเวลาเข้ามาเกี่ยวข้องด้วยนั่นเองครับ ดังนั้นเวลาไปใช้ที่ไหน ใช้ให้ถูกหน่อยนะครับ Prevalence ไม่ต้องมีหน่วยของเวลา แต่ถ้า Incidence นั่นต้องมีแน่ๆ อย่าใช้สับสนกันนะครับ

20 มีนาคม 2552

Understanding Risk

“ความเสี่ยง” นั้นเป็นเรื่องยากที่จะอธิบายให้เข้าใจได้ง่ายๆ แต่ส่วนใหญ่แล้วเรามักจะพูดถึงอัตราการเกิดโรคต่างๆ นั้นเป็นความเสี่ยงครับ

พอดีช่วงนี้ยุ่งนิดหน่อย แต่ไปเจอเว็บไซต์รายงานข่าวของ BBC News ที่พูดเรื่องเกี่ยวกับความเสี่ยงดังกล่าวเป็นกราฟฟิคที่เข้าใจง่ายๆ เลยมาลองให้ดูกันครับ

เข้าไปดูที่ BBC News กันเลยครับ: How to understand risk in 13 clicks.

01 มีนาคม 2552

Precision, Accuracy, Bias, Chance

วันนี้พักเรื่องสถิติ มาคุยกันเรื่องความเที่ยงตรงและความแม่นยำกันนะครับ

หนึ่งในเรื่องที่น่าสนใจของการทำการศึกษาก็คือเรื่องของ ความผิดพลาดที่เกิดจากการศึกษา ทุกคนคงทราบดีว่ามันไม่สามารถที่การศึกษาใดๆ จะทำนายผลลัพธ์ได้ตรงเผง 100% ดังนั้นมันจึงเกิดคำว่า Error ขึ้นมาครับ

คำว่า Error นั้นเป็นคำรวมๆ หมายถึงความผิดพลาดที่เกิดขึ้น ซึ่งอาจเกิดจากความตั้งใจหรือไม่ตั้งใจก็ได้ครับ ในทางระบาดวิทยาและสถิติแล้ว เราแบ่งความผิดพลาเป็นสองแบบใหญ่ๆ คือ

  • ความผิดพลาดที่เกิดขึ้นอย่างไม่เป็นระบบ (Non-Systematic Error หรือที่เรียกว่า Random Error) บางคนเรียกว่า Chance
  • ความผิดพลาดที่เกิดขึ้นเป็นระบบ (Systematic Error) หรือที่เรียกว่า Bias

พูดมาตรงนี้ก็อาจจะงงเล็กน้อย ผมจะลองอธิบายด้วยวิธีที่หนังสือส่วนใหญ่ใช้ นั่นก็คือ เกมปาเป้าครับ

ในเกมปาเป้านั้นจุดมุ่งหมายก็คือพยายามทำให้ลูกดอกนั้นเข้าตรงเป้ามากที่สุด เหมือนกันกับที่เราทำวิจัย เราก็มีจุดมุ่มหมายทำให้ผลลัพธ์ที่เกิดขึ้นนั้นตรงกันกับความเป็นจริงในธรรมชาติมากที่สุดเหมือนกัน

อย่างไรก็ตาม ทุกคนที่ปาเป้าก็คงเข้าใจว่าถึงจะปาให้ดียังไง ก็คงไม่สามารถจะตรงเป้าตลอดกาลได้ (ยกเว้นคุณจะแม่นมากๆ แต่คงจะมีไม่กี่คนที่แม่นเป๊ะขนาดนั้น) สมมุติว่าปาไปสี่ดอก มันก็คงจะไม่ลงตรงจุดเดียวกันเสียทีเดียว คงมีเบี้ยวไปข้างซ้ายบ้าง เบี้ยวไปขวาบ้าง

Chance

นี่ละครับคือที่มาของคำว่า Random Error (Chance) นั่นก็คือว่าไม่ได้มีใครอยากที่จะให้มันเกิด แล้วเวลามันเกิดแล้วมันก็มีโอกาสไปได้ทุกๆ ด้าน ทั้งด้านบน ด้านล่าง ด้านซ้าย หรือด้านขวา

แต่หากว่ามีคนสายตาเอียงมาปา ลองนึกภาพดูว่ามันจะเกิดอะไรขึ้นนะครับ

Bias

จะเห็นว่าเพราะเขาตาเอียง ถึงแม้ว่าจะแม่นเพียงไหน เขาก็จะปาเบี้ยวไปตลอดทุกที

ความเที่ยงตรง (Precision) นั้นก็เปรียบได้กับในการปาลูกดอกในแต่ละครั้ง ว่ามันจะเบี้ยวซ้าย เบี้ยวขวาไปสักเท่าไหร่ (มันจะ Precise ได้สักเท่าไหร่) ยิ่งปาเก่ง ฝึกบ่อย มันก็จะทำให้เที่ยงตรงมากขึ้นเรื่อยๆ บางคนเรียกว่า มันสามารถจะทำซ้ำ แล้วผลลัพธ์ออกมาแบบเดิมได้ซักเท่าไหร่ (Reproducability/Repeatablility) หรือจะพูดย้อนไปคือ มันมี Random Error ซักแค่ไหนกัน

สำหรับความแม่นยำ หรือ Accuracy  นั้นก็คือมัน “ตรงเป้า” ซักแค่ไหน คือคนปาเนี่ยสายตาเอียงหรือเปล่า ถ้ามีอะไรมาบังตา ก็จะทำให้ความแม่นยำนั้นลดลง เปรียบได้กับว่าแว่นนั้นคือ Bias ที่ทำให้ลูกดอกที่ปาออกไปมันผิดปกติไปในทางเดียวกัน

หนังสือหลายเล่มจะแสดงรูปสี่รูปต่อไปนี้ครับ:

accur-precis

นั่นก็คือ จากรูปบนซ้าย จะเห็นได้ว่านักปาเป้านั้นทั้งซ้อมบ่อย แล้วก็ไม่ตาเอียง (Random error น้อย, ไม่มี Bias)

ส่วนรูปบนขวานั้นซ้อมบ่อยจริง แต่ดันตาเอียง (Random error น้อย แต่ดันมี Bias)

ในทางกลับกันรูปล่างซ้ายนั้นซ้อมไม่บ่อย แต่โชคดีที่ตายังไม่เอียง (Random error เยอะกว่า แต่โชคดีที่ไม่มี Bias)

และรูปล่างขวานั้นคงไม่มีใครอยากให้เกิด เพราะนอกจากจะอ่อนซ้อมแล้วยังตาเอียงไปทางขวาอีก -_-“ (นั่นคือมีทั้ง Random error เยอะ และมีทั้ง Bias อีกต่างหาก)

หรือถ้าผมจะเรียงให้ดูมันก็จะเป็นไปตามนี้ครับ:

precise

accurate

 

สำหรับ Bias ที่เกิดขึ้นนั้นเกิดได้จากหลายสาเหตุครับ ไว้โอกาสหน้าจะมาอธิบายต่อครับ