醫(yī)學(xué)期刊統(tǒng)計(jì)學(xué)錯(cuò)誤思考

2021-4-9 | 醫(yī)學(xué)教育科技論文

本文作者：張巧蓮鄭玉建單位：新疆醫(yī)科大學(xué)學(xué)報(bào)編輯部新疆醫(yī)科大學(xué)公共衛(wèi)生學(xué)院

在醫(yī)學(xué)論文寫(xiě)作中,醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法應(yīng)用是必不可少的,正確使用能保證科研工作順利進(jìn)行,并使科研成果更具有科學(xué)性、代表性和可靠性。反之,如果使用不當(dāng)或者誤用,會(huì)直接影響研究結(jié)果的質(zhì)量,反而會(huì)使讀者產(chǎn)生誤解,甚至有時(shí)會(huì)導(dǎo)致錯(cuò)誤的結(jié)論。近年來(lái)，醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法在醫(yī)學(xué)科研中的應(yīng)用越來(lái)越受到國(guó)內(nèi)廣大醫(yī)學(xué)科研工作者的重視，統(tǒng)計(jì)分析結(jié)果表達(dá)已成為醫(yī)學(xué)論文中一個(gè)不可缺少的重要組成部分。醫(yī)學(xué)統(tǒng)計(jì)學(xué)是評(píng)價(jià)醫(yī)學(xué)科技論文質(zhì)量?jī)?yōu)劣的重要依據(jù)，然而從近年發(fā)表的論文來(lái)看,有不少作者對(duì)統(tǒng)計(jì)方法的使用還不熟悉,實(shí)際應(yīng)用中統(tǒng)計(jì)方法濫用、錯(cuò)用和誤用的情況時(shí)有發(fā)生[1]。據(jù)國(guó)外20世紀(jì)60年代到80年代對(duì)不同醫(yī)學(xué)期刊發(fā)表論文的調(diào)查，有統(tǒng)計(jì)學(xué)錯(cuò)誤的論文比例最高者達(dá)66％，最低者也有20％[2-4]。國(guó)內(nèi)有學(xué)者對(duì)5種中華醫(yī)學(xué)會(huì)系列雜志論著中統(tǒng)計(jì)學(xué)方法的應(yīng)用狀況進(jìn)行了調(diào)查，結(jié)果顯示，1985年統(tǒng)計(jì)錯(cuò)誤的論文比例為24％,1995年為36％[5]。這些調(diào)查研究均說(shuō)明統(tǒng)計(jì)方法誤用的嚴(yán)重性以及正確應(yīng)用的緊迫性。國(guó)外從20世紀(jì)70年代起就有針對(duì)醫(yī)學(xué)論文的科研設(shè)計(jì)與統(tǒng)計(jì)方法應(yīng)用情況的調(diào)查研究，國(guó)內(nèi)學(xué)者也進(jìn)行了相關(guān)研究[6]。這種研究有助于及時(shí)了解醫(yī)學(xué)科研論文中統(tǒng)計(jì)方法的應(yīng)用質(zhì)量，發(fā)現(xiàn)存在的問(wèn)題，提高醫(yī)學(xué)科研工作者應(yīng)用統(tǒng)計(jì)方法的水平。筆者總結(jié)了近年來(lái)已發(fā)表的醫(yī)學(xué)科技論文中常見(jiàn)的統(tǒng)計(jì)學(xué)問(wèn)題，希望能引起各位專(zhuān)家學(xué)者和臨床醫(yī)生的共識(shí)與重視，促進(jìn)我國(guó)醫(yī)學(xué)期刊質(zhì)量的提高。

1　統(tǒng)計(jì)設(shè)計(jì)存在的常見(jiàn)問(wèn)題

統(tǒng)計(jì)設(shè)計(jì)是整個(gè)研究中最重要的一環(huán),是研究工作應(yīng)遵循的依據(jù)。常見(jiàn)的統(tǒng)計(jì)設(shè)計(jì)問(wèn)題有:忽視組間均衡性,樣本缺乏代表性,樣本例數(shù)不足,未設(shè)置對(duì)照組,未隨機(jī)分組,未提出統(tǒng)計(jì)分析方法等。針對(duì)以上問(wèn)題,在科研設(shè)計(jì)中一定要遵循實(shí)驗(yàn)設(shè)計(jì)的四大原則即“隨機(jī)、對(duì)照、均衡、重復(fù)”的原則[6]。

1.1不遵循或不重視隨機(jī)化原則

隨機(jī)化是科研設(shè)計(jì)的重要原則，直接影響研究結(jié)果的可信度。隨機(jī)化既要隨機(jī)抽樣，還要隨機(jī)分組，并有足夠的樣本量作前提。然而，在醫(yī)學(xué)論文中許多作者對(duì)此不夠重視，主要表現(xiàn)在論文中統(tǒng)計(jì)處理隨機(jī)化不突出，隨機(jī)化缺失情況比較常見(jiàn)，有的論文甚至將隨機(jī)誤解為隨意、隨便，不采用隨機(jī)化處理方法，導(dǎo)致結(jié)果缺乏可靠性。還有些文章中沒(méi)有提出“隨機(jī)”抽樣的設(shè)計(jì)與方法，沒(méi)有排除標(biāo)準(zhǔn)，給人隨意選擇病例之感，且病例數(shù)少，因此沒(méi)有代表性，所得出的結(jié)論不可靠。部分文章雖然注明了“隨機(jī)”，但未提及采取什么方法進(jìn)行隨機(jī)化研究或兩組間的例數(shù)相差甚遠(yuǎn)，不符合隨機(jī)化的一般規(guī)律，沒(méi)有臨床參考價(jià)值[7]。

1.2缺少對(duì)照研究或?qū)φ战M設(shè)計(jì)不合理

正確設(shè)立對(duì)照是臨床或?qū)嶒?yàn)研究的一個(gè)核心問(wèn)題，設(shè)立對(duì)照的意義在于說(shuō)明臨床試驗(yàn)或?qū)嶒?yàn)研究中干預(yù)措施的效應(yīng)，減少或防止偏倚和機(jī)遇產(chǎn)生的誤差對(duì)試驗(yàn)結(jié)果的影響。目前，國(guó)內(nèi)許多期刊發(fā)表的論文對(duì)照組設(shè)計(jì)不合理現(xiàn)象比較普遍，尤其有些作者對(duì)某種新藥或新技術(shù)在臨床的應(yīng)用觀察研究中，不設(shè)對(duì)照組，缺乏對(duì)照觀察，得出的結(jié)論缺乏科學(xué)性，令人懷疑。有的文章雖然設(shè)立了對(duì)照組，但在分析結(jié)果時(shí)，卻沒(méi)有將試驗(yàn)組與對(duì)照組的結(jié)果進(jìn)行比較，而僅將各組間的自身前后進(jìn)行比較，從而使該研究失去對(duì)照意義。對(duì)照組選擇不當(dāng)，還表現(xiàn)在兩組間重要的臨床特征和基線情況相差太大，無(wú)可比性，如性別、年齡、病情、經(jīng)濟(jì)情況和文化程度等不一致，如有些論文將健康人或志愿者作為對(duì)照組，使結(jié)果受到非處理因素的影響，產(chǎn)生偏倚或系統(tǒng)誤差，使結(jié)論不可信[7]。

1.3均衡性原則掌握不夠

均衡性原則要求實(shí)驗(yàn)中的各組之間除處理因素不同外，其他可控制的非處理因素要盡可能保持一致。特別對(duì)疾病預(yù)后有重要影響的臨床特性一定要在組間分布均衡。各組間越均衡，可比性越強(qiáng)。有些作者在對(duì)病例進(jìn)行分組時(shí)，忽視了均衡性原則，兩組之間沒(méi)有可比性，結(jié)論自然是錯(cuò)誤的。具體表現(xiàn)在：有的文章對(duì)治療組與對(duì)照組的相應(yīng)統(tǒng)一指標(biāo)沒(méi)有設(shè)在均衡的水平上。對(duì)治療組情況交代的比較詳細(xì)，而對(duì)對(duì)照組的年齡、性別、病情等不予交代，或所選對(duì)照組的年齡與治療組不在一個(gè)年齡段，影響了作者對(duì)指標(biāo)的觀察[7]。

1.4重復(fù)的原則掌握不好

所謂重復(fù),一是指重復(fù)試驗(yàn)或平行試驗(yàn),二是指各樣本組的例數(shù)要有一定的數(shù)量,即樣本的例數(shù)要足夠大。雖然隨機(jī)化是增強(qiáng)非處理因素均衡性的重要方法,但當(dāng)各組內(nèi)例數(shù)過(guò)少時(shí),盡管采用了隨機(jī)化分組的方法,也難以保證非處理因素的均衡一致。在隨機(jī)化分組的基礎(chǔ)上,只有樣本例數(shù)足夠大,才能使非處理因素均衡一致,同時(shí)也才能使抽樣誤差減小,增強(qiáng)樣本對(duì)總體的代表性。一般來(lái)說(shuō),在隨機(jī)分組的前提下,樣本例數(shù)越大,各組之間非處理因素的均衡性越好;但當(dāng)樣本量太大時(shí),往往又會(huì)給整個(gè)實(shí)驗(yàn)和質(zhì)量控制工作帶來(lái)更多的困難,同時(shí)也會(huì)造成浪費(fèi)。為此,在實(shí)驗(yàn)設(shè)計(jì)時(shí),還應(yīng)保證在實(shí)驗(yàn)結(jié)果具有一定可靠性的前提下,確定最少的樣本例數(shù)。一般說(shuō)來(lái),計(jì)數(shù)指標(biāo)每組樣本不得少于20～30例,計(jì)量指標(biāo)每組樣本不得少于5～10例。在多因素分析時(shí),一般認(rèn)為樣本例數(shù)至少為觀察指標(biāo)的5～10倍[8]。

1.5樣本的含量

樣本的含量的大小直接影響到結(jié)論的可靠性。樣本量過(guò)少,則抽樣誤差大,結(jié)果可靠性差,且經(jīng)不起重復(fù)驗(yàn)證;反之,盲目加大樣本量也會(huì)造成人、財(cái)、物的浪費(fèi),同時(shí)也造成非抽樣誤差增大。故應(yīng)在保證研究結(jié)果精確可靠的前提下,確定最小的樣本量。如某篇論文報(bào)道某藥治療的臨床療效,實(shí)際總例數(shù)為10例,其中6例有效,于是作者得出有效率為60%。顯然,有限的病例數(shù)不能充分說(shuō)明該藥是否有效,作者貿(mào)然得出結(jié)論,容易給他人造成假象甚至誤導(dǎo)[9]。

2　統(tǒng)計(jì)方法選擇與使用不當(dāng)

在選擇統(tǒng)計(jì)方法之前,首先應(yīng)確定研究資料是計(jì)數(shù)資料還是計(jì)量資料。只劃分其類(lèi)別而得到的資料為計(jì)數(shù)資料,也叫定性資料,如根據(jù)治療結(jié)果計(jì)算出的治愈率、陰性率、陽(yáng)性率等。測(cè)定某個(gè)具體數(shù)值而得到的資料為計(jì)量資料,如血壓值、血細(xì)胞計(jì)數(shù)、血氧分壓測(cè)定等許多物理診斷和化驗(yàn)檢查的結(jié)果。目前,醫(yī)學(xué)論文中計(jì)數(shù)資料最常用的統(tǒng)計(jì)方法為χ2檢驗(yàn),計(jì)量資料最常用的統(tǒng)計(jì)方法為t檢驗(yàn)。值得注意的是,各種假設(shè)檢驗(yàn)方法均有其適用條件,應(yīng)根據(jù)資料特點(diǎn)來(lái)選用最適當(dāng)?shù)姆椒ā＞鶖?shù)與標(biāo)準(zhǔn)差分別是描述正態(tài)分布資料集中和離散趨勢(shì)的指標(biāo)。能否選用“均數(shù)±標(biāo)準(zhǔn)差”來(lái)描述某一資料的分布特征,關(guān)鍵看該資料是否符合正態(tài)分布。當(dāng)資料不符合正態(tài)分布或方差不齊時(shí),應(yīng)將資料轉(zhuǎn)換使之符合正態(tài)分布,方差齊性后再用t檢驗(yàn)或方差分析,否則用秩和檢驗(yàn)。有些作者在使用t檢驗(yàn)時(shí),未考慮到上述適用條件而盲目使用,造成統(tǒng)計(jì)學(xué)處理不當(dāng)或統(tǒng)計(jì)學(xué)計(jì)算錯(cuò)誤[10]。

SCI期刊領(lǐng)域

今日更新

隨機(jī)閱讀

導(dǎo)航列表

熱門(mén)文章

鏈接

Top

国产视频www-国产视频xxx-国产视频xxxx-国产视频一二-一本大道香蕉中文日本不卡高清二区-一本久久精品一区二区

醫(yī)學(xué)期刊統(tǒng)計(jì)學(xué)錯(cuò)誤思考