• EN    |    TH

หลักการจัดชั้นของหลักฐานวิทยาศาสตร์ (Level of evidence – LOE) มีหลักการคล้ายคลึงกันไม่ว่าจะใช้เกณฑ์ของสถาบันไหนในการแบ่ง ในที่นี้จะยึดมาตรฐานของคณะทำงานช่วยชีวิตนานาชาติ (ILCOR) เป็นมาตรฐานในการจัดระดับชั้น ในความเป้นจริงแล้วอาจกล่าวได้ว่า การจะเข้าใจเรื่องชั้นของหลักฐานทางวิทยาศาสตร์การแพทย์นั้นเป็นเรื่องยาก แม้แต่คนที่อยู่ในวงการวิทยาศาสตร์การแพทย์บางกลุ่มก็ยังไม่เข้าใจถึงความสำคัญของการวิเคราะห์หลักฐานวิทยาศาสตร์เพื่อการนำข้อมูลมาใช้ประโยชน์อย่างถูกต้อง เพราะการนำข้อมูลทางสุขภาพผิดๆมาใช้นอกจากจะไม่ช่วยให้คนมีสุขภาพดีขึ้นแล้วยังอาจจะทำให้สุขภาพแย่ลงได้อีกด้วย

การแบ่งชั้นของหลักฐานวิทยาศาสตร์ตามเกณฑ์ของ ILCOR[1] จะแบ่งออกเป็น 5 ระดับตามความเชื่อถือได้จากมากไปหาน้อย ดังนี้

ได้แก่ งานวิจัยสุ่มตัวอย่างเปรียบเทียบ (randomized controlled trial – RCT) หมายถึงงานวิจัยที่เอาผู้ป่วยมาสุ่มตัวอย่างแบ่งเป็นสองกลุ่มแล้วเปรียบเทียบวิธีรักษาแบบดั้งเดิมกับแบบแทรกแซง การสุ่มตัวอย่าง      (randomization) เป็นวิธีแบ่งกลุ่มที่ตัดปัจจัยกวนที่ซุกซ่อนอยู่ข้างใดข้างหนึ่งมากเกินออกไปได้อย่างเด็ดขาด เป็นการตัดผลของความเชื่อ (placebo effect) ต่อการดำเนินของโรค

ยกตัวอย่างงานวิจัยระดับ 1 เช่น งานวิจัยการรักษาโรคหัวใจด้วยการปรับวิถีชีวิต ที่ทำโดยนายแพทย์ดีน ออร์นิช (Dean Ornish)[2, 3] เพื่อที่จะตอบคำถามว่าการให้ผู้ป่วยปรับวิธีใช้ชีวิตจะมีผลรักษาโรคหัวใจจริงหรือไม่ เขาเอาผู้ป่วยที่ป่วยด้วยโรคหัวใจขาดเลือดที่ได้สวนหัวใจฉีดสีถ่ายรูปไว้แล้วว่าเป็นโรคหลอดเลือดหัวใจตีบแน่นอนจำนวน 93 คน เอามาสุ่มตัวอย่างแบ่งเป็นสองกลุ่ม กลุ่มหนึ่งเป็นกลุ่มควบคุม ให้ได้รับการรักษาและดูแลตัวเองตามวิธีปกติ อีกกลุ่มหนึ่งเป็นกลุ่มแทรกแซง ให้ปรับวิธีใช้ชีวิตตัวเองไปอย่างสิ้นเชิงในสี่ประเด็นคือ (1) ให้กินแต่อาหารพืชแบบไม่ใช้น้ำมันไม่สกัดไม่ขัดสี (2) ให้ออกกำลังกายสม่ำเสมอ (3) ให้ทำกิจกรรมจัดการความเครียดทุกวัน (4) ให้เข้ากลุ่มเพื่อนช่วยเพื่อนสัปดาห์ละครั้ง แล้วตามดูไปนาน 5 ปีเพื่อดูว่าทั้งสองกลุ่มโรคจะดำเนินไปต่างกันอย่างไร โดยใช้การวัดรอยตีบที่ภาพหลอดเลือดที่ได้จากการสวนหัวใจ การนับจำนวนการเจ็บหน้าอก และจำนวนครั้งที่ต้องเข้ารักษาในโรงพยาบาลเป็นตัวชี้วัด พอตามดูไปได้หนึ่งปีก็นัดผู้ป่วยทุกคนมาสวนหัวใจฉีดสีและประเมินตัวชี้วัดครั้งหนึ่ง ซึ่งพบว่ากลุ่มที่ให้ปรับการใช้ชีวิตด้วยอาหารพืชแบบไม่ใช้น้ำมันไม่สกัดไม่ขัดสี (เนื้อนมไข่ปลาไม่กินเลย) ออกกำลังกาย และจัดการความเครียด รอยตีบที่หลอดเลือดกลับกลายเป็นขยาย “โล่งขึ้น” จากเดิม 4.5% ขณะที่กลุ่มควบคุม รอยตีบที่หลอดเลือดเดินหน้าตีบ “แคบลง” ไปจากเดิม 5.4% ตัวเลขใกล้กัน แต่ไปคนละทิศทาง ในส่วนของอาการเจ็บหน้าอกนั้นก็พบว่ากลุ่มที่ปรับการใช้ชีวิตด้วยอาหารมังสวิรัติไขมันต่ำ ออกกำลังกาย จัดการความเครียด มีอาการเจ็บหน้าอก “น้อยลง” 91% ส่วนกลุ่มควบคุมนั้นมีอาการเจ็บหน้าอกเพิ่มขึ้น 165% 

เมื่อสิ้นสุดงานวิจัยแล้วเขาตามดูผู้ป่วยทั้งสองกลุ่มนี้ไปจนครบ 5 ปีแล้วเอากลับมาสวนหัวใจและประเมินตัวชี้วัดใหม่ก็ยังได้ผลแตกต่างกันแบบเดิมแต่ชัดเจนยิ่งขึ้น กล่าวคือเมื่อวัดรอยตีบที่หลอดเลือดหัวใจพบว่ากลุ่มที่ปรับการใช้ชีวิตรอยตีบ “โล่งขึ้น” จากเดิมไปอีกเป็น 7.9% ขณะที่กลุ่มควบคุมรอยตีบ “ตีบแคบลง” กว่าเดิม 27.7% และเมื่อดูอัตราการต้องเข้าโรงพยาบาลก็พบว่ากลุ่มปรับวิถีชีวิตเข้าโรงพยาบาลเฉลี่ยเพียงคนละ 0.89 ครั้ง ขณะที่กลุ่มควบคุมเข้าโรงพยาบาลเฉลี่ยคนละ 2.25 ครั้ง 

เขาจึงสรุปผลวิจัยของเขาว่าการการให้ผู้ป่วยโรคหัวใจปรับการใช้ชีวิตตนเองด้วยการกินอาหารพืชแบบไม่ใช้น้ำมันไม่สกัดไม่ขัดสี ออกกำลังกาย จัดการความเครียด และเข้ากลุ่มช่วยเหลือกันและกัน มีผลพลิกผัน (reverse) โรคหลอดเลือดหัวใจตีบ ทำให้หลอดเลือดที่ตีบไปแล้วกลับโล่งขึ้นมาใหม่ได้

ได้แก่ งานวิจัยติดตามกลุ่มคนแบบไปข้างหน้า (prospective cohort study) คือเมื่อเริ่มวิจัยก็เอากลุ่มคนทั้งหมดมาลงทะเบียนไว้ ตรวจประเมินและบันทึกตัวชี้วัดต่าง ๆ แล้วตามไปตรวจประเมินอีกเป็นระยะ ๆ เพื่อจะดูว่าการได้รับปัจจัยเสี่ยงหรือการถูกแทรกแซงแบบไหน จะมีผลต่อการเกิดหรือการหายของโรคอย่างไร โดยที่กลุ่มคนที่ได้มานี้ได้มาโดยการอาสาสมัคร ไม่มีการสุ่มตัวอย่างคัดเลือก หากจะมีการแบ่งกลุ่มก็เป็นการแบ่งกลุ่มเอาตามความแตกต่างระหว่างกันที่แต่ละคนเป็นมาหรือมีมาแต่เดิม ไม่ได้สุ่มตัวอย่างแบ่งกลุ่ม 
ยกตัวอย่างงานวิจัยระดับ 2 เช่น งานวิจัยของฮาร์วาร์ดเพื่อจะตอบคำถามว่าไขมันชนิดไหนทำให้ป่วยและตายจากโรคหัวใจมากที่สุด[4] เขาตั้งต้นวิจัยโดยเอาคนมาที่ยังไม่ป่วยมา 80,082 คน ทำการสอบถามอาหารการกินเป็นระยะ ๆ ในระหว่างที่ติดตามดูไป 14 ปี มีคนป่วยหนักและตายจากโรคหัวใจ 939 คน เมื่อศึกษาลักษณะการกินไขมันเทียบกับโอกาสป่วยหนักและตายจากโรคหัวใจก็พบว่า สำหรับทุก ๆ 5% ของแคลอรีที่ผู้ป่วยกินเมื่อเทียบกับแคลอรีที่ได้จากคาร์โบไฮเดรต พบว่า
หากเป็นแคลอรีที่ได้จากไขมันทรานส์ (น้ำมันพืชที่ใส่ไฮโดรเจนให้แข็งขึ้น เช่น ครีมเทียม เนยเทียม เค้ก คุ้กกี้ ขนมกรุบกรอบ) จะสัมพันธ์กับการป่วยหนักและตาย “มากกว่า” แคลอรีที่ได้จากคาร์โบไฮเดรตถึง 93% 
หากเป็นแคลอรีที่ได้จากไขมันอิ่มตัว (เช่น น้ำมันหมู น้ำมันวัว น้ำมันปาล์ม) จะสัมพันธ์กับการป่วยหนักและตาย ”มากกว่า” แคลอรีที่ได้จากคาร์โบไฮเดรต 17% 
หากเป็นแคลอรีที่ได้จากไขมันไม่อิ่มตัวเชิงเดี่ยว (คือน้ำมันพืช เช่น น้ำมันมะกอก) จะสัมพันธ์กับการป่วยหนักและตาย “น้อยกว่า” แคลอรีที่ได้จากคาร์โบไฮเดรต 19% 
หากเป็นแคลอรีที่ได้จากไขมันไม่อิ่มตัวเชิงซ้อน (คือน้ำมันพืช เช่น น้ำมันถั่วเหลือง) จะสัมพันธ์กับการป่วยหนักและตาย “น้อยกว่า” แคลอรีที่ได้จากคาร์โบไฮเดรต 38%
ทีมผู้วิจัยจึงสรุปว่าในบรรดาแหล่งแคลอรีที่คนปกติบริโภค ไขมันทรานส์เป็นแหล่งแคลอรีที่ชั่วร้ายมากที่สุด มีความสัมพันธ์กับการป่วยหนักและตายด้วยโรคหัวใจมากที่สุด

งานวิจัยแบบตามดูกลุ่มคนนี้บางครั้งก็ทำกับคนจำนวนไม่มาก แต่หากออกแบบงานวิจัยให้ดี มีการติดตามตัวชี้วัดที่ละเอียด ก็อาจจะใช้ประโยชน์ได้กว้างขวาง ยกตัวอย่างเช่นงานวิจัยของหมอเอสซี่ (Caldwell B. Esselstyn) ที่โรงพยาบาลคลีฟแลนด์[5] เขาตั้งต้นเอาคนป่วยโรคหัวใจขาดเลือดที่เป็นโรคระดับมากแล้วและได้ตรวจสวนหัวใจทุกคนแล้วมา 24 คน ซึ่งในแปดปีที่ผ่านมาก่อนหน้านั้นคนเหล่านี้ได้เกิดกล้ามเนื้อหัวใจตายเฉียบพลัน (heart attack) ไปแล้ว 49 ครั้ง เขาเอามาทำวิจัยโดยให้คนเหล่านั้นกินอาหารพืชแบบไม่ใช้น้ำมันไม่สกัดไม่ขัดสี ในปีแรกที่ทำการวิจัย ผู้ป่วยจำนวน 6 คน ทนอาหารผักหญ้าไม่ไหวขอเลิกไปกลางคัน เมื่อตามดูผู้ป่วยทั้ง 24 คนนี้ไปห้าปี พบว่ากลุ่มที่เลิกกลางคันไป 6 คนเกิดกล้ามเนื้อหัวใจตายเฉียบพลันอีก 13 ครั้ง ในขณะที่กลุ่มที่กินอาหารพืชแบบไขมันต่ำไม่สกัดไม่ขัดสีต่อไปได้ครบห้าปี ไม่มีใครเกิดกล้ามเนื้อหัวใจตายเฉียบพลันเลย และตามดูต่อไปถึง 10 ปีในกลุ่มหลังนี้ก็ไม่มีใครเกิดกล้ามเนื้อหัวใจตายเฉียบพลัน เมื่อตอนที่ครบห้าปี มีคนไข้ที่กินมังสวิรัติ 11 คนยอมให้สวนหัวใจ ซึ่งก็พบว่าไม่มีคนไข้คนไหนเลยที่โรคเป็นมากขึ้นกว่าเดิมเมื่อห้าปีก่อน โดยที่มีอยู่ 8 คน (73%) ที่ผลการสวนหัวใจพบว่าโรคลดถอยลงไปจากเดิม หรือพูดง่าย ๆ ว่าโรคถอยกลับ (reverse) ได้ 

 นอกจากนี้ ยังรายงานว่าโคเลสเตอรอลเฉลี่ยของทั้งกลุ่มลดจาก 246 มก./ดล.เหลือต่ำกว่า 150 มก./ดล. และผลการตรวจสวนหัวใจพบว่าจากรอยตีบที่ตรวจทั้งหมด 25 จุด พบโล่งขึ้น 11 จุด อีก 14 จุดที่เหลือหยุดนิ่งไม่ตีบมากขึ้นแม้จะผ่านไปสิบปี ในรายงานวิจัยนี้ยังได้แสดงภาพผลการตรวจสวนหัวใจให้เห็นหลอดเลือดของผู้ป่วยก่อนเริ่มการวิจัยซึ่งขรุขระตีบแคบเป็นเส้นยาว กลับกลายเป็นหลอดเลือดที่เปิดโล่งเป็นปกติเมื่อกินอาหารมังสวิรัติไปได้สามปี 
จะเห็นว่างานวิจัยนี้ แม้คนที่ถูกแทรกแซงและตามดูจะเป็นกลุ่มขนาดเล็ก ไม่ได้สุ่มตัวอย่างเปรียบเทียบกันเป็นสองกลุ่ม แต่ด้วยวิธีติดตามและแสดงหลักฐานประกอบอย่างชัดเจนก็กลายเป็นงานวิจัยที่ได้รับการยอมรับและใช้เป็นที่อ้างอิงถึงอย่างกว้างขวางได้ 

ในกรณีทั่วไป สาเหตุที่งานวิจัยที่ไม่มีการสุ่มตัวอย่างได้รับความเชื่อถือน้อยกว่างานวิจัยแบบสุ่มตัวอย่าง ก็เพราะการไม่ได้สุ่มตัวอย่างบางครั้งทำให้มีปัจจัยกวนที่เป็นสาเหตุการเจ็บป่วยที่แท้จริงแฝงอยู่โดยนักวิจัยไม่ทราบหรือคิดไม่ถึง ดังนั้นงานวิจัยแบบไม่สุ่มตัวอย่างหรือแบบ cohort นี้จะต้องมีการสอดส่ายมองหาและขจัดปัจจัยกวนอย่างละเอียดจึงจะได้ผลวิจัยที่เชื่อถือได้
ยกตัวอย่างผลของปัจจัยกวนดังกล่าวเช่นงานวิจัยติดตามดูกลุ่มคนญี่ปุ่นในฮาวายสองกลุ่มคือคนดื่มกาแฟกับคนไม่ดื่มกาแฟ โดยไปศึกษาเอาคนที่เขาดื่มหรือไม่ดื่มของเขาเองอยู่แล้ว ไม่มีการสุ่มตัวอย่างแยกกลุ่ม เมื่อตามดูไปห้าปีพบว่าคนดื่มกาแฟป่วยและตายจากโรคหัวใจขาดเลือดมากกว่าคนที่ไม่ดื่มกาแฟ จึงนำไปสู่ข้อสรุปที่ผิดพลาดว่ากาแฟทำให้ป่วยและตายจากโรคหัวใจขาดเลือดมากขึ้น ซึ่งวงการแพทย์มาพบในภายหลังว่าเป็นข้อสรุปที่ไม่เป็นความจริง ทั้งนี้เป็นเพราะในงานวิจัยนั้นมีปัจจัยกวนอยู่คือการสูบบุหรี่ กลุ่มคนที่ดื่มกาแฟในงานวิจัยนั้นสูบบุหรี่มากกว่ากลุ่มคนที่ไม่ดื่มกาแฟโดยธรรมชาติอยู่แล้ว เมื่อแบ่งกลุ่มระหว่างดื่มกับไม่ดื่มกาแฟ คนสูบบุหรี่ก็ตกไปอยู่ข้างกลุ่มดื่มกาแฟมากกว่าข้างกลุ่มไม่ดื่มกาแฟ บุหรี่ซึ่งเป็นสาเหตุการตายที่แท้จริงของโรคหัวใจขาดเลือดจึงทำให้กลุ่มที่ดื่มกาแฟตายมากกว่ากลุ่มที่ไม่ดื่ม และนำไปสู่ผลสรุปการวิจัยที่ผิดความจริงดังกล่าว เมื่อทำการวิเคราะห์ข้อมูลใหม่โดยตัดเอาคนสูบบุหรี่ออกไปเสียจากทั้งสองกลุ่ม ข้อสรุปที่ได้ก็คือกาแฟไม่ได้ทำให้อัตราการป่วยและตายจากโรคหัวใจขาดเลือดเพิ่มขึ้นแต่อย่างใด         

ได้แก่ งานวิจัยกลุ่มคนแบบย้อนหลัง (retrospective study) 
ยกตัวอย่างงานวิจัยระดับ 3 เช่นงานวิจัยเพื่อจะตอบคำถามว่าการดื่มกาแฟสัมพันธ์กับการที่สมองจะไม่เสื่อมจริงหรือไม่[6] เขาเอาผู้ป่วยสมองเสื่อมมา 54 คน แล้วไปเอาคนธรรมดาที่มีอายุและลักษณะอื่น ๆ คล้าย ๆ กันแต่ไม่ได้เป็นสมองเสื่อมมาอีก 54 คน แล้วตรวจสอบย้อนหลังถึงปริมาณกาแฟที่ดื่มใน 20 ปีที่ผ่านมาของคนทั้งสองกลุ่ม พบว่ากลุ่มที่เป็นสมองเสื่อมดื่มกาแฟที่มีคาเฟอีนเฉลี่ย 73.9 มิลลิกรัมต่อวัน (เทียบเท่ากาแฟประมาณครึ่งแก้ว) ส่วนกลุ่มที่ไม่ได้เป็นสมองเสื่อมดื่มกาแฟที่มีคาเฟอีนเฉลี่ย 198.7 มิลลิกรัมต่อวัน (เทียบได้กับกาแฟประมาณหนึ่งแก้วครึ่ง) จึงสรุปงานวิจัยว่าคนชอบดื่มกาแฟมาก สัมพันธ์กับการเป็นสมองเสื่อมน้อยกว่าคนไม่ชอบดื่มกาแฟ 
หากจะเทียบงานวิจัยแบบไม่มีการสุ่มตัวอย่างด้วยกัน งานวิจัยแบบย้อนหลังมีโอกาสเกิดปัจจัยกวนมากมายเสียยิ่งกว่าการวางแผนวิจัยแบบตั้งใจขจัดปัจจัยกวนเสียแต่แรกแล้วติดตามดูแบบไปข้างหน้า งานวิจัยแบบย้อนหลังจึงได้รับความน่าเชื่อถือน้อยเป็นอันดับที่สามรองลงไปจากงานวิจัยสุ่มตัวอย่าง (RCT) และแบบตามดูไปข้างหน้า (prospective cohort) และมีบ่อยครั้งมากที่งานวิจัยแบบย้อนหลังได้ข้อสรุปออกมาผิดความจริง ซึ่งทราบได้จากการที่หลังจากนั้นเมื่อมีผู้มาทำการวิจัยนั้นซ้ำแต่ใช้วิธีวิจัยแบบไปข้างหน้าหรือในแบบสุ่มตัวอย่าง (RCT) แล้วพบว่าได้ผลเป็นอีกอย่างหนึ่ง
อย่างไรก็ตามในงานวิจัยผลของพฤติกรรมเช่นเรื่องการกิน การออกกำลังกาย ต่อการมีสุขภาพดีต้องติดตามดูนานเกินสิบปีหรือยี่สิบปีขึ้นไป การวิจัยระดับชั้นหนึ่งคือวิจัยแบบสุ่มตัวอย่างแบ่งกลุ่มเปรียบเทียบมักทำไม่ได้เพราะไปติดตรงที่จะบังคับคนให้ทำอย่างนั้นอย่างนี้ไปนาน ๆ ไม่ได้ วงการแพทย์จึงจำเป็นต้องอาศัยผลวิจัยระดับตามดูกลุ่มคนหรือระดับระบาดวิทยานี้เป็นหลัก โดยใช้วิธีมองภาพใหญ่เข้ามาประกอบ หมายความถ้าสำรวจวิจัยไปหลาย ๆ กลุ่มชนหรือหลาย ๆ ประเทศต่างก็ล้วนได้ผลเป็นอย่างเดียวกัน ความน่าเชื่อถือก็จะมากขึ้นแม้จะไม่ใช่ผลวิจัยระดับชั้นหนึ่งก็ตาม 

ได้แก่ รายงานผู้ป่วยที่ไม่มีระเบียบวิธีวิจัยและไม่มีการติดตามที่ดี (case series) เป็นเพียงแต่เล่าเรื่องว่าได้ทำการรักษาบางอย่างกับผู้ป่วยจำนวนหนึ่งแล้วได้ผลอย่างไรก็รายงานให้ทราบ.

เช่น งานวิจัยในสัตว์ (animal model) หรืองานวิจัยจากห้องทดลอง (laboratory model) หรืองานวิจัยจากโรงงาน (mechanical model) หรือการคาดเดาผลวิจัยหนึ่ง ข้ามไปใช้กับอีกกลุ่มประชากรหนึ่งซึ่งมีความแตกต่างกัน (extrapolation) ทั้งหมดนี้ในทางการแพทย์และวิทยาศาสตร์ถือว่าเป็นหลักฐานที่ยังไม่พร้อมที่จะนำมาใช้ในคน แต่ว่ามีการอ้างเอางานวิจัยแบบนี้มาสนับสนุนการขายสินค้าและบริการทางด้านสุขภาพในอินเทอร์เน็ตเป็นอันมาก 
 ยิ่งไปกว่านั้น ข้อมูลที่เผยแพร่อย่างดาษดื่นในอินเทอร์เน็ตจำนวนมากเป็นข้อมูลอีกชนิดหนึ่งซึ่งไม่ใช่หลักฐานวิทยาศาสตร์ระดับใดระดับหนึ่งในห้าระดับข้างต้นเลย เรียกว่าเป็นข้อมูลไม่มีระดับชั้น เช่น เรื่องเล่าสู่กันฟัง (anecdote) บ้าง คำให้การของผู้ที่อ้างตนเป็นแบบอย่างหรือเป็นพยาน (testimonial) บ้าง ความเห็นของผู้เชี่ยวชาญ (expert opinion) บ้าง ซึ่งเผอิญมักจะเป็นผู้เชี่ยวชาญปลอม หรือไม่ก็เป็นผู้เชี่ยวชาญจริงแต่มีวาระซ่อนเร้นในการจะขายของหรือการรับจ้างบริษัทขายของมาพูด ข้อมูลเหล่านี้เกือบทั้งหมดเป็นการคาดเดาหรือไม่ก็จงใจบิดเบือนให้คนเข้าใจหลักฐานวิทยาศาสตร์ผิดไป ที่สำคัญคือข้อมูลที่แพร่กระจายกันทางอินเทอร์เน็ตและสื่อสังคมออนไลน์ส่วนใหญ่ (ผมเดาว่าเกิน 80% ขึ้นไป) เป็นข้อมูลชนิดนี้