Các giá trị p gây hiểu lầm xuất hiện thường xuyên hơn trong các bài báo của tạp chí y sinh, nghiên cứu tìm thấy

Một đánh giá về giá trị p trong tài liệu y sinh từ 1990 đến 2015 cho thấy những thống kê bị hiểu lầm rộng rãi này đang được sử dụng ngày càng nhiều, thay vì các số liệu tốt hơn về kích thước hiệu ứng hoặc độ không chắc chắn.
                                                

Một nghiên cứu của hàng triệu bài báo cho thấy các tác giả của họ ngày càng báo cáo giá trị p nhưng thường làm như vậy một cách sai lệch, theo một nghiên cứu của các nhà nghiên cứu tại Đại học Y khoa Stanford. Giá trị P là thước đo có ý nghĩa thống kê nhằm đưa ra kết luận khoa học.

Vì giá trị p thường bị áp dụng sai, nên việc sử dụng chúng tăng lên có lẽ không cho thấy sự cải thiện trong cách tiến hành nghiên cứu y sinh học hoặc cách phân tích dữ liệu, các nhà nghiên cứu phát hiện.

"Nó thường là một kỹ thuật dưới mức tối ưu, và sau đó nó được sử dụng theo cách thiên vị, vì vậy nó có thể trở nên rất sai lệch", John Ioannidis, MD, DSc, giáo sư về phòng chống dịch bệnh và chính sách và nghiên cứu y tế và đồng giám đốc của Trung tâm Đổi mới Nghiên cứu Meta tại Stanford.

Nghiên cứu sẽ được công bố vào ngày 15 tháng 3 năm JAMA . Ioannidis là tác giả cao cấp. Tác giả chính là David Chavalarias, Tiến sĩ, Giám đốc Viện Hệ thống Phức tạp ở Pháp.

Khi p-value = bối rối

Nhóm Ioannidis đã sử dụng khai thác văn bản tự động để tìm kiếm cơ sở dữ liệu y sinh MEDLINE và PubMed Central để xuất hiện các giá trị p trong hàng triệu bản tóm tắt và cũng đã xem xét thủ công 1000 bản tóm tắt và 100 bài báo đầy đủ. Tất cả các bài báo đã được xuất bản từ năm 1990 đến 2015.

Việc lạm dụng phổ biến các giá trị p thường tạo ra ảo tưởng về nghiên cứu đáng tin cậy đã trở thành một sự bối rối đối với một số lĩnh vực học thuật, bao gồm tâm lý học và y sinh, đặc biệt là khi Ioannidis bắt đầu xuất bản các phê bình về cách tiến hành nghiên cứu hiện đại.

Các báo cáo trong Tự nhiên, STAT và FiveThentyEight, chẳng hạn, đã bao gồm các điểm yếu của giá trị p. Vào ngày 7 tháng 3, Hiệp hội Thống kê Hoa Kỳ đã đưa ra một cảnh báo tuyên bố chống lại việc lạm dụng của họ. Trong một trong một loạt các bài tiểu luận kèm theo tuyên bố, nhà dịch tễ học của Đại học Boston, ông Kenneth Rothman, DMD, DrPH, đã viết, "Đây là những vấn đề nguy hiểm. … , các nhà báo và những người khác) đã sử dụng các bài kiểm tra quan trọng để giải thích kết quả và do đó đã không xác định được các khóa hành động có lợi nhất. "

                                            
                                            

Tại Stanford, nhóm của Ioannidis nhận thấy rằng trong số hàng triệu tóm tắt y sinh trong cơ sở dữ liệu, báo cáo về giá trị p đã tăng hơn gấp đôi từ 7,3% năm 1990 lên 15,6% vào năm 2014. Tóm tắt từ các tạp chí y học chính, 33 phần trăm báo cáo giá trị p và trong tập hợp các thử nghiệm lâm sàng ngẫu nhiên có kiểm soát, gần 55% báo cáo giá trị p.

Ý nghĩa của giá trị p

Giá trị P được thiết kế để chiếu sáng một câu hỏi hóc búa thống kê cơ bản. Giả sử một thử nghiệm lâm sàng so sánh hai phương pháp điều trị bằng thuốc và thuốc A dường như hiệu quả hơn 10% so với thuốc B. Điều đó có thể là do thuốc A thực sự hiệu quả hơn 10%. Hoặc đó có thể là cơ hội vừa xảy ra để làm cho thuốc A xuất hiện hiệu quả hơn trong thử nghiệm đó. Nói tóm lại, thuốc A có thể đã gặp may mắn. Làm thế nào để bạn biết?

Giá trị p ước tính khả năng dữ liệu có thể xuất hiện theo cách họ đã làm nếu "giả thuyết khống" là đúng trong trường hợp này, rằng không có sự khác biệt giữa tác dụng của thuốc A và B. Vì vậy, không có sự khác biệt giữa tác dụng của thuốc A và B. Vì vậy, ví dụ: nếu thuốc A và B có hiệu quả như nhau và bạn thực hiện một nghiên cứu so sánh chúng, giá trị p là 0,05 có nghĩa là thuốc A sẽ có hiệu quả ít hơn 10% so với thuốc B khoảng 5% thời gian.

Nói cách khác, giả sử các loại thuốc có tác dụng tương tự, giá trị p ước tính khả năng nhận được kết quả cho thấy A tốt hơn ít nhất 10%.

"Định nghĩa chính xác của giá trị p," Ioannidis nói, "là nếu giả thuyết null là chính xác, giá trị p là cơ hội quan sát kết quả nghiên cứu hoặc một số kết quả cực đoan hơn." Thật không may, nhiều nhà nghiên cứu đã lầm tưởng rằng giá trị p là ước tính về khả năng giả thuyết null không đúng hoặc kết quả là đúng.

Giá trị P

"Giá trị p không cho bạn biết liệu điều gì đó có đúng hay không. Nếu bạn nhận được giá trị p là 0,01, điều đó không có nghĩa là bạn có 1% khả năng điều gì đó không đúng", Ioannidis nói thêm. "Giá trị p là 0,01 có thể có nghĩa là kết quả có khả năng là 20%, 80% có khả năng là đúng hoặc 0,1% có khả năng là đúng với tất cả các giá trị p. Chỉ riêng giá trị p không nói lên cho bạn biết kết quả của bạn đúng như thế nào. "

Để ước tính thực tế về khả năng kết quả là đúng hay sai, Ioannidis nói, các nhà nghiên cứu nên sử dụng tỷ lệ phát hiện sai hoặc tính toán yếu tố Bayes.

Mặc dù những hạn chế nghiêm trọng của giá trị p, chúng đã trở thành một biểu tượng của thiết kế thử nghiệm tốt trong thời đại hiện nay. Nhưng thật không may, chúng không chỉ là một biểu tượng. Ioannidis và nhóm của ông đã phát hiện ra rằng trên thực tế, các giá trị p duy nhất được báo cáo trong các tóm tắt là những giá trị được định nghĩa hơi tùy tiện là số "có ý nghĩa thống kê" thường được đặt ở mức dưới 0,05. Nhóm nghiên cứu nhận thấy 96% tóm tắt với giá trị p có ít nhất một giá trị p "có ý nghĩa thống kê" như vậy.

"Điều đó cho thấy có áp lực chọn lọc ủng hộ kết quả cực đoan hơn. Thực tế là bạn có rất nhiều kết quả quan trọng là hoàn toàn phi thực tế. Không thể nào 96% trong số các giả thuyết được thử nghiệm là có ý nghĩa", Ioannidis nói.

Nhưng hiệu ứng này lớn đến mức nào?

Mặc dù số lượng báo cáo tăng lên cho thấy kết quả có ý nghĩa thống kê, nhưng một số bài báo đã báo cáo mức độ ảnh hưởng của việc điều trị so với đối chứng hoặc giả dược. Ví dụ, giả sử 10.000 bệnh nhân cho thấy sự cải thiện trung bình các triệu chứng có ý nghĩa thống kê so với 10.000 bệnh nhân khác không dùng thuốc. Nhưng nếu bệnh nhân dùng thuốc chỉ tốt hơn 1%, thì ý nghĩa thống kê thu được từ giá trị p có thể sẽ không có giá trị thực tế.

Trong số 796 bài báo được nhóm Ioannidis xem xét thủ công có chứa dữ liệu thực nghiệm, chỉ có 111 kích cỡ hiệu ứng được báo cáo và chỉ có 18 khoảng tin cậy được báo cáo (thước đo độ không chắc chắn về cường độ của hiệu ứng). Cuối cùng, không có yếu tố Bayes nào được báo cáo hoặc tỷ lệ phát hiện sai, mà Ioannidis nói là phù hợp hơn để cho chúng tôi biết nếu những gì được quan sát là đúng. Ít hơn 2 phần trăm tóm tắt mà nhóm đánh giá đã báo cáo cả kích thước hiệu ứng và khoảng tin cậy.

Trong một đánh giá thủ công 99 bài báo toàn văn được chọn ngẫu nhiên với dữ liệu, 55 đã báo cáo ít nhất một giá trị p, nhưng chỉ có bốn khoảng tin cậy được báo cáo cho tất cả các kích thước hiệu ứng, không sử dụng phương pháp Bayes nào và chỉ có một tỷ lệ phát hiện sai được sử dụng

Ioannidis ủng hộ các cách tiếp cận nghiêm ngặt hơn để phân tích dữ liệu. "Cách để tiến về phía trước", ông nói, "là các giá trị p cần được sử dụng một cách chọn lọc hơn. Khi được sử dụng, chúng cần được bổ sung bởi các kích thước hiệu ứng và độ không chắc chắn [confidence intervals]. Và nó thường là một ý tưởng tốt để sử dụng cách tiếp cận Bayes hoặc tỷ lệ phát hiện sai để trả lời câu hỏi, 'Khả năng kết quả này là đúng như thế nào?' "

Kỹ thuật tối ưu

Giá trị P là một kỹ thuật tối ưu và chúng thường được sử dụng theo cách sai lệch, sai lệch, ông nói. "Trên toàn bộ tài liệu, các phương pháp thống kê được sử dụng thường không tối ưu. Giá trị P có khả năng rất sai lệch và chúng được báo cáo có chọn lọc để ủng hộ các kết quả quan trọng hơn, đặc biệt là trong các tóm tắt. Và các tác giả sử dụng các số liệu sẽ có ý nghĩa hơn và nhiều hơn hữu ích để có kích thước hiệu ứng, khoảng tin cậy và các số liệu khác có thể tăng giá trị trong việc hiểu ý nghĩa của kết quả. "
                                                                                                                        


                                            Các nghiên cứu y học với kết quả nổi bật thường chứng minh sai

                                        



                                                    Cung cấp bởi
                                                                                                            Trung tâm y tế Đại học Stanford

                                                
                                                                                                                        
                                        
                                        

                                            

                                                  Trích dẫn :
                                                 Các giá trị p gây hiểu lầm xuất hiện thường xuyên hơn trong các bài báo tạp chí y sinh, nghiên cứu tìm thấy (2016, ngày 15 tháng 3)
                                                 lấy ngày 20 tháng 3 năm 2019
                                                 từ https://medical े. com / news / 2016-03-p-values-biomedical-journal-articles.html
                                            

                                            

                                            Tai liệu nay la chủ thể để co quyên tac giả. Ngoài bất kỳ giao dịch công bằng cho mục đích học tập hoặc nghiên cứu tư nhân, không
                                            một phần có thể được sao chép mà không có sự cho phép bằng văn bản. Nội dung được cung cấp chỉ phục vụ cho mục đích thông tin.
                                            

                                        

                                        

Các giá trị p gây hiểu lầm xuất hiện thường xuyên hơn trong các bài báo của tạp chí y sinh, nghiên cứu tìm thấy
Rate this post