论文中统计描述要怎么写,来看看杂志主编的建议
科研论文是出现研讨结果的一种最好的表示情势,此中数据阐发的成果则是论文中最为焦点的一部门。每当我们辛费力苦写好文章,自大满满投稿后,有时刻却连Editor初审的第一关都过不了,乃至惨遭Editor“秒拒”。Editor固然没有研讨的原始数据,然则他们都有一双火眼金睛,常能发现许多日常平凡我们没有注意到的差错和问题。
The International Journal of Occupational and Environmental Medicine(The IJOEM)杂志的主编Farrokh Habibzadeh传授颁发了一篇名为《Statistical Data Editing in Scientific Articles》的文章[1],针对在论文中进行数据编纂时常犯的差错和必要注意的处所,进行了具体的阐明,让我们来一路看看Editor怎么说。
一、统计办法描写

一样平常环境下,在论文办法(Method)的末了一部门,要求作者对统计阐发办法进行具体的描写。通常包含几个内容:
1、数据阐发所使用的软件及其版本、所属公司、公司所属地等信息。例如:The data were analysed by SPSS version 24.0 for Windows (SPSS Inc., Chicago, IL, USA).
2、数据成果的出现和描写情势。例如:Continuous variables with normal distribution were presents as mean±standard deviation (SD); non-normal variables were reported as median (interquartile range).
3、数据阐发时所用到的统计查验办法。例如:Mean of two continuous normally distributed variables were compared by independent samples Student's test.
4、设定的假设查验水准。例如:A value of P<0.05 was considered significant.
注意:在统计办法描写部门,有些作者不管什么类型的研讨论文,都复制粘贴使用统一个固定的描写模板,如许很容易被Editor发现,统计办法必需要依据本身数据的现实环境,以及真正所使用到的统计办法来进行先容,万弗成张冠李戴。
二、数据的准确度
有些作者在成果描写中太甚于寻求数据的精度,例如一篇文章中如许描写:The mean work experience of studied participants was 20.365 (SD, 4.35) years。
此中有2个问题:起首,均数和尺度差的小数位数在出现时没有坚持同等;其次,事情履历的均值准确到了3位小数,这就意味着在对事情履历这个变量进行查询拜访时,准确到了以“小时”为单元,而在现实的查询拜访进程中一样平常最多准确到以“月”为单元,是以建议此处的描写改动为20.4 (SD, 4.4) years。
一样平常环境下,在描写均值、尺度差、中位数、四分位间距等指标时,建议小数位数不要跨越原始丈量数据的小数位数。
对付百分位数的描写,当分母小于100时,一样平常建议百分位数不保存小数,而当分母小于20时,就不再建议使用百分最近进行描写了。例如:Of 15 patients studied, 26.67% presented with fever,此处百分位数计算的分母为15<20,是以建议改动为:4 of 15patients presented with fever。
但有时在不易得到分母详细数值的环境下,可以依据百分数和绝对数的年夜小来进行辅助断定。当百分数年夜于绝对数时,提醒分母小于100,此时百分位数可以不消保存小数。例如:“31 (42.47%) patients……”,此时百分数42.47%年夜于绝对数31,提醒分母小于100 (现实上分母为73),则此处建议改动为:“31 (42%)patients……”。
三、常用的统计描写指标
对付正态散布的材料,一样平常采纳均值 (Mean) 和尺度差 (Standard Deviation, SD) 来描写数据的集中趋向和离散环境,而对付非正态散布的材料,常用中位数 (Median) 和四分位间距 (Interquartile Range, IQR) 来描写数据的集中趋向和离散环境,这就要求要起首对数据材料的散布特色进行查验。
然则在多半论文中,作者并未直接给出正态性查验的成果。在无法得到原始数据的环境下,我们可以依据尺度差和均值的年夜小进行初步断定。若尺度差跨越均值的一半,则提醒数据很有可能长短正态散布,可以参考前期推送的有关数据的内容进行进修。
因为尺度误 (Standard Error of Mean, SEM) 比尺度差小,有些作者为了掩饰笼罩数据非正态散布的特色,差错地将尺度误作为描写数据离散趋向的一个指标。但现实上,尺度误反映的是均数抽样偏差的年夜小,而非样本材料的离散环境,此时用尺度误来权衡数据材料的离散趋向是不正确的。
95%置信区间(95%CI),可以用均值±1.96*尺度误来进行计算。一种环境,当申报某种疾病的患病率时,建议同时申报其95%CI。例如:26 of 300 studied participants had brucellosis translating to a prevalence of 8.7% (95%CI, 5.5% to 11.9%)。依据95%CI的计算公式,数据材料的均值约即是95%CI上、下限的均值,如8.7%=(5.5%+11.9%)/2, 以此来赞助断定成果是否同等。
另一种环境,多见于描写RR (Relative Risk) 值或者OR (Odds Ratio) 值时,必要申报其95%CI。例如:Smoking was associated with a higher incidence of lung cancer (OR, 2.6; 95%CI, 1.3 to 5.2)。此时RR或OR值的平方即是95%CI上、下限的乘积,如2.62=1.3*5.2,以此来赞助断定成果是否同等。
四、诊断实验的成果申报
对付诊断实验,通常在论文中必要描写的指标包含敏锐度、特异度、阳性猜测值、阴性猜测值及其95%CI等。当使用ROC (Receive Operating Characteristic) 曲线进行阐发时,则还必要申报曲线下面积及其95%CI、截断值 (cut-off point)等信息。
五、丈量单元
精确描写丈量单元也长短常紧张的。例如经常在文章中见到相似的描写:Serum cholesterol levels was 5.22。缺失响应的单元“mmol/L”,这种漏掉的环境在表格及图的坐标轴中也常常呈现。年夜多半学术杂志都保举使用国际单元(SI),是以当某个指标有分歧的计量单元时,也建议同一换算为国际单元。
六、P值
P值的描写在论文中也常呈现各类问题,一些杂志仅要求在描写P值时给出其断定尺度,例如:P<0.05, 或non-significant,而多半杂志则要求在论文中申报精确的P值。一样平常环境下描写P值时建议不要跨越3位小数,例如P=0.0123,可改动为P=0.012。但有时P值很小,例如P=0.0000123,只若保存三位小数,即P=0.000,此时建议将其描写为P<0.001。值得注意的是,只有当进行假设查验时才必要提供P值。
此外,当可以或许同时获取95%CI和P值时,一样平常建议仅申报95%CI即可,由于P值仅提醒假设查验有无统计学明显性,而95%CI还可以直观的显示效应值的规模。例如:Smoking was significantly associated with a higher incidence of lung cancer (OR, 2.6; P=0.04),建议改动为:Smoking was associated with a higher incidence of lung cancer (OR, 2.6; 95%CI, 1.3 to 5.2)。
对付P值的解释必定要谨严,在设定查验程度α为0.05的环境下,分外是当P值在临界值邻近时,例如P=0.049时以为有统计学明显性,而P=0.051则以为无统计学明显性,下结论的时刻要严防发生I类差错和II类差错,有可能会做出假阳性或假阴性的结论(参考前期推送的有关先容的内容)。
通常把这种环境描写为部门明显性(partially significant)或边沿明显性(marginally significant)(可参考前期推送的有关的内容进行描写)。假如没有充足的证据证实该效应值在人群中现实上存在明显性,而阴性成果可能是因为抽样偏差造成的,那么我们就应该遵照游戏规矩,当设定α=0.05时,若假设查验得出P≥0.05,即以为无统计学明显性,作者可以在论文的讨论部门对其缘故原由进行具体探究。
七、生计阐发
Cox比例风险模子(Cox proportional hazard model)以生计终局和生计光阴为因变量,在校订多种稠浊因素后,用来阐发研讨因素对付终局的影响。必要注意的是,Cox模子的根本假定是比例风险假定(PH假定),只有在满意PH假定的条件下,基于此模子的阐发才是靠得住有用的,然而对付该假定的查验每每被研讨职员所疏忽。
查验PH假定最简单的办法便是察看依照研讨变量分组后的Kapla-Meier生计曲线,若生计曲线显著交叉,则提醒不满意PH假定。详细可以参考前期推送的有关的内容进行进修。
以上是杂志主编针对论文中进行数据编纂时,常呈现的差错和必要注意的处所总结的几项心得,愿望可以或许赞助年夜家避免再犯此类的差错。小伙伴们在撰写文章和进行投稿时,还有哪些领会和感触感染值得引起年夜家注意的,也迎接和我们一路来分享哈。
参考文献
[1] J Korean Med Sci 2017; 33: 1072-76