您好, 访客   登录/注册

内容分析在组织管理研究中的应用与实例

来源:用户上传      作者:

   摘要:内容分析在组织领域的应用已有30多年的时间,通过对文本材料的编码,研究者可以获取丰富的研究数据。相比较于二手数据与问卷调查,内容分析更适合对处于早期阶段的理论提供实证证据。通过对研究假设、选取材料、词典开发、编码与数据分析等关键过程进行讨论,并以基于经验学习理论开展的内容分析研究为例,阐释如何应用该研究方法促进新理论的开发。
  关键词:内容分析;经验学习;个体反思
  内容分析是为对信息特征进行系统地、客观地、定量地分析,核心价值基于对语言在人类认知中的重要性的承认(Neuendorf,2016)。内容分析的关键假设是通过对各种介质的文本材料(比如文本、音频、图像等)进行分析,研究者可以理解其他人的认知模式。词频被认为是反映认知中心的指标,分析的目标就是“对关键词计数”。内容分析的另外一个假设是词群可以反映研究主题,关键词的共现可以被解释为主题之间的联系(Huff,1990)。
   内容分析在组织管理学领域的应用已经有30多年历史,在1980年~2005年间被用于组织认知(比如团队心智模型、认知变革)、战略管理(比如战略群组、CEO继任)、国际组织等话题的研究,内容分析对许多难以开展实证检验的组织管理学研究提供了研究方法(Duriau et al.,2007)。在组织管理学的研究中,许多重要的新理论仍处在发展阶段,比如组织自恋、体验式学习、社会价值、组织风险等。新理论的主要变量之间的关系以及背后逻辑可能已比较成熟,但是缺少一致的经验证据支撑或者假设边界不清,需要进一步完善。促进理论开发的方法之一就是内容分析,通过定制化的词典开发将理论变量与实证检验联系起来,构建可重现的数据库,可以持续可靠地对变量进行评价(Krippendorff,2012)。内容分析可以充实变量的概念及变量间的关系,识别理论适用边界与时间性的条件。
   计算机使得对大规模文本材料进行内容分析成为可能。利用计算机,可以将某些任务自动化,比如数据存储、词频计算等,也可以实现某些环节的半自动化,比如词典开发、编码等,提高研究项目的扩展性。利用内容分析来质询与求证组织管理学当下问题的条件已经成熟,但是国内管理学文献中对内容分析的应用多停留基于现成词典的词频分析,一方面,研究的话题受词典的局限;另一方面,对文本材料的利用程度较低。因此,本研究以基于经验学习理论的个体反思内容分析研究为例,讨论文本分析的各个环节及关键点,重点分析词典演绎式与归纳式的开发方法以及编码过程,并简要介绍我们如何通过内容分析获取研究变量的量化数据,构建结构方程完成假设检验。
   一、 内容分析是否可以捕捉隐性内容
   相对于二手数据或者问卷调查,已有研究认为内容分析至少在以下几个方面具有优势。首先,内容分析可以深入接触个人或集体的结构,比如价值观、目的、态度与认知。其次,内容分析有较强的分析弹性,研究者可以基于文本的表面信息统计词频,也可以通过文本解释与统计推断探索深层含义。最后,内容分析是非介入式的研究方法,研究者可以单方面完成问题的询问与回答不影响研究对象。
   内容分析的基础是对文本材料的显性内容进行定量分析。显性内容是呈现于内容载体表面可计量的成分,可以直接进行观察识别,比如特定词语的出现、人物的动作等。显性内容所见即所得,对信息的利用基于大多数人共享的特定符号的“外延意义”。显性内容的直接性与表面性,致使早期内容分析研究流于肤浅。
   Hair等(1988)认为内容分析法可以对信息特征进行研究,而信息特征不直接外显于文本,“无法直接测量但能够被一个或多个指标描绘或测量”,需要分析者通过上下文语境对文本的“内涵意义”进行解读。对隐性内容的挖掘与分析是通过将相关变量进行操作化定义,转化为显性变量实现的。对隐性内容的测量可以被应用于特定理论的实证检验,好的内容分析设计往往以理论为基础,其核心变量通过理论发展明确(周翔,2014)。大部分研究将理论作为对假设中变量关系进行内容分析的逻辑基础,根据文献中变量的定义衍生出内容分析的编码类目与类目关系組合。对理论的把握可以提高研究者的理论触觉,能够快速从原始研究资料中抓取关键性问题。我们的在开发反思词典进行文本分析时以经验学习为理论基础,该理论认为挑战性经验促进个体学习,Kolb(1984)提出了经验学习的四阶段模型,即观察、反思性评价、概念提炼,实验。从经验向学习的转化机制的研究仍停留在理论层面,缺少实证证据支持。Mann等(2009)在回顾这方面研究时指出:“关于反思的一个关键假设就是它可以提升能力……,但至今我们并没有证据支持或拒绝该假设”。我们提出了研究假设,挑战性经验与学习行为显著正相关,自我反思起中介作用。
   二、 数据来源
   文本材料是关键变量信息的载体,因此需要对文本材料对研究问题的适用性进行充分说明。以经验学习的研究为例,数据获取是量化个体反思面临的一个主要困难,因为个体反思往往发生在工作情境中消极事件的应对过程中,问卷调查很难事后反映出当时的事件场景和情绪体验。为此,我们采取情景导向内容分析方法,从文本材料中识别出挑战性经验、个体反思与学习行为这三个关键变量。我们的研究情景是王品集团的幼狮计划。幼狮是企业从大学招聘的应届生,通过6个月的在职培训将成为企业旗下餐饮门店(副)店长。每位幼狮被要求在每周写一篇学习心得,回顾培训内容与收获,我们以2011年~2015年五期共计3 322份学习心得作为分析材料。幼狮的工作挑战主要来自两方面:一方面他们需要在与餐饮顾客的接触中成长起来(称为“外部经验”),另一方面他们学会如何更好地与店铺其他角色的同仁有效共事(称为“内部经验”)。日记或周记是个体进行反思的一种方式,学习心得以周记的形式进行,可以帮助幼狮与已发生的事件或行动保持距离,避免个人概念保护带来的偏差。学习行为体现在幼狮在自我评价的进步以及采取的诸如试错、构建人际关系等主动行为。综上,幼狮学习心得与经验学习理论良好契合,通过挖掘文本材料的隐性内容可以反映个体反思等关键变量。    三、 定制词典开发
   内容分析将从特定目的的词典开发中受益,词典开发完成后,文本向定量数据的转化将是直接的产出,但是词典开发将是一个艰难的过程。现成词典并不是专为某种理论设计,类目的维度划分不够细致,比如经常被用于研究投资者情绪的情绪词典,只有积极情绪与消极情绪的分类。对于新理论而言,现成词典难以反映关键变量的含义。组织管理领域的词典以英文为主,缺少可用的中文词典。因此,我们将进行定制化词典的开发。
   词典开发有归纳或演绎两种方式。演绎式的词典开发方法是通过对相关主题的高被引文章的详尽搜索,从已有研究中识别变量的各个维度与相关的词语。归纳式的词典开发方法是从选定的文本中识别高频词语进行归类,并给出该类词组所反映变量的概念化定义。归纳式词典的外部效度受限于特定场景,因为词语的选择来源于特定的文本材料。两种词典开发方式可以结合(Mckenny et al.,2012),通过演绎式词典开发得到具有情景普适性的词典,运用归纳式词典开发对演绎式词典进行补充,并开发适用于材料情景的针对性词典。组织管理领域对个人反思的影响因素以及相应结果变量的研究较少且实证结果存在矛盾,演绎式的词典开发无法获取相对完备的词典。本研究将介绍演绎式与归纳式结合的词典开发方法。
   1. 演绎式词典开发。演绎式词典开发始于对理论的文献回顾以识别变量的各种维度、实证研究中的操作化定义以及变量相关的词语。我们回顾了过去30年发表在顶级管理学期刊9篇经验学习文献,10篇自我反思的文献,9篇团队反思的文献,识别出挑战性经验特征、情绪、反思标志等9个词典。当变量从已有文献中被识别出来之后,由3名研究者独立使用Nvivio 11软件Word格式的学习心得进行编码,为词典开发下级类目并识别词语,类目对应文献中变量的不同纬度。当从文献中不能识别出新的词语后,我们停止了独立工作。
   第二步,统一词典结构与词语列表。由1名研究者提出观点,另外2名支持或者辩驳,不断修正与补充,减少个体偏见、主观性。最后我们得到101个词语。第三步,寻求外部专家反馈。外部专家可以提高词典的表面效度,并且保证我们对词典的分类是得到理论支持的。专家的选择以研究领域、活跃度为首要条件,专家数量根据实际情况确定。以本研究为例,我们邀请研究方向为领导行为并且近三年在主流管理学期刊有发表的专家为我们提供诊断。专家为我们补充了学习行为的维度,增加反思内容的词语,并向我们介绍了积极主动行为的3篇文献。根据专家建议,我们增加了“主动行为”词典反映幼狮的学习过程,词语相应增加15个。第四步,预编码。随机抽取100份文本进行预编码,主要检验词典是否能够涵盖主要的研究内容,是否存在未识别的类目。
   2. 归纳式词典开发。完成演绎式词典开发后,我们进行了归纳式词典开发。第一步,对文本材料进行分词。因为5期的培训方案基本相同,我们选择文本材料最多的第三期(873份/3 322份)使用R的“Rwordse”库进行分词,直接进行分词会得到信息含量较低但是高频的停用词,我们通过载入哈工大停用词表删除这类词语,分词后得到20 275个词组。第二步,确定高频词语。已有文献并没有对“高频”定义,考虑到词语数量与重要性,我们选取词频数前20%(大于等于11)的词语作为高频词语,共计3 864个。第三步,词典迭代开发。基于幼狮培训的特定情境,3位研究员按照演绎式词典开发第2步的过程,开发了场景特征、场景人物、场景时间等3部针对性词典。3位研究者各自独立地将高频率词语归入演绎式开发的10部普适性词典与3部针对性词典,分类完成后3位研究者交流各自分类依据,移除词义模糊不清或者明显与变量不相关的词语,将分类结果送交外部专家诊断。以上过程需要经过反复迭代,是词典开发最耗时的步骤,持续5个月时间。
   3. 词典调整。编码结果是词典内容的被动反应,在编码之前需要对词语进行必要的调整。首先,确保词典中的词语的唯一性。当一个词语被归类到两个以上类目时,一个可行的方案是在使用该词的文本材料中随机抽取若干份,分析关键词出现的语境,只有当某种用法占比80%以上时才予以保留(Bengstono & Xu,1995),否则删除该词语。比如我们研究中遇到的“PASS”一词,其含义是通过还是淘汰需要在文本中寻找,最终得出结论PASS在幼狮训练中指的是淘汰。如果词典词语数量较多,另一种可行的方案通过编码人员的讨论取得一致结果,将仍存在歧义的词语删除。
   其次,判断词语的含义是否被文本中负面意义的词语所改变。我们专门构建了否定词词典,将具有否定意义的词语单独列出,比如将识别的“不耐烦”“不满”等词中的“不”作为否定词,而在其他字典的词语中不再包含具有与定义相反意义的词语,以使各变量的中的词语更加符合定义。
   最后,我们将拥有相同主干、词义相同的表现形式不同的词语,比如,“成就”“成就感”,保留词语的主干,合并为同一个词“成就”;但是有共同主干的词语可能被划分为不同类目,比如“意识”与“意识到”,分别被划入了反思過程与反思标志,为了在计算机编码时能够区分这组词,我们较长的词语进行英文替换,即将“意识到”替换为“Realize”。经过以上调整,我们最终得到分类一致的词语927个。
   4. 信度与效度检验。为了计算上述词语分类的信度,本研究邀请另外3位没有参与前阶段词典开发工作的研究助理判断各变量及类目下的词语是否符合定义。本研究反映编码者两两之间分类一致性的Kappa系数均值0.889,词典具有良好的信度;内容分析更多依赖表面效度,因为该研究方法关注文本的阅读,文本中的象征意味着什么等问题的解答很大程度基于常识或此类话题的共识。本研究通过邀请外部专家、3位研究者独立确定变量及词语归类,并进行词典反复迭代以提高词典的表面效度。完成编码进行实证研究时我们进行数据分析时,我们对关键变量进行验证性因素分析,通过对比4因子模型及其他模型,检验挑战性经验、个体反思、行为反应、价值观反应之间的区分效度。    四、 编码过程与数据分析
   应用词典将文本材料编码,是完成定性描述向定量数据转化的最后一步。在正式开始编码前,需要对文本内容进行清理。我们首先将文章的标题、日期、幼狮姓名等干扰内容删除,利用VBA在学习心得的各段段首按顺序添加编号,将“日期+姓名+段落”作为段落识别标志。其次,以句为单位进行统计与判断。本研究借助计算机自动编码,使用Stata 14统计文本材料中各关键词的词频,变量默认值设置为0。我们在这一步考虑了否定词对语义的影响,判断出现挑战性经历、情绪、自我评价等变量的句子中是否存在否定词,若存在,则进行词义调整,比如否定词加激活的消极情绪调整为激活的积极情绪;判断出现反思类词语的句子的主语以确定反思主语;“反思过程”词典中的词语出现在段落中时可能与反思无关,我们在编写程序中考虑了先对“反思标志”进行识别,然后在同一句内判断是否出现“反思过程”。“反思参照点”的判断与“反思过程”相同,将范围扩大至出现反思的句子以及前后一句。
   词频计算完毕后,我们对类目进行量化。以段为单位,类目的关键词出现大于等于1次,则该类目取值1,否则取值0。编码完毕后由3位研究者随机选择30份报告检验编码准确性;在数据清理阶段,内容少于30个中文字的段落被删除,初始数据库包括22 016个观测值;本研究将段落层面的编码数据聚合到周报层面,并根据周报的段落数进行标准化,最终得到以篇为最小单位的类目的量化数据。对文本分析定量数据的应用主要有两种。第一种是单变量分析,考察变量随着时间的变动趋势、变量的组间差异、变量之间共现关系;第二种是用于实证检验,通过构建回归模型、结构方程等考察变量的预测效力。我们考察挑战性经历与行为反应、价值观反应的关系,以及自我反思的中介作用与培训时间的调节作用。我们从编码过程获取的类目数据反映的是研究变量的各个维度,即我们的研究变量是潜变量,类目相当于潜变量的各个因子。因此,我们构建了结构方程,采用Mplus 7对理论模型进行检验。
   五、 结论
   本研究讨论了内容分析考察文本的层次不局限于显性信息,对隐形信息的捕捉是当下研究的主流。我们回答了是否需要依据理论提出研究问题、演绎式与归纳式的词典开发方法、编码与数据分析的过程等问题。在文章中我们介绍了基于王品集团幼狮计划的文本分析过程,强调了对文本材料合理性的说明,并对外部专家、高频词语的选择进行了解答。基于幼狮在培训期间记录的学习心得,我们获取了测量挑战性经验、个体反思、行为反应等关键变量的定量数据,并进一步构建结构方程,为经验学习理论对变量关系的预测提供了实证证据。文本分析提供了推动处于新理论发展的工具,通过开发定制化词典,可以完善理论关键变量的外延与界限以及为实证检验提供丰富数据。
  参考文献:
  [1] Bengston D N, Xu Z.Changing national forest values: a content analysis[J].Research Paper Nc,1995,1(1):1-29.
  [2] Durlau V J,Reger R K,Pfarrer M D. A content analysis of the content analysis literature in organization studies: Research themes, data sources, and methodological refinements[J].Organizational research methods,2007,10 (1):5-34.
  [3] Hair J F, Black W C, Babin B J, et al. Multivariate data analysis[M].NJ:Prentice hall Upper Saddle River,1998:581.
  [4] Huff A S.Mapping strategic thought[M].NY: John Wiley & Sons,1990:21.
  [5] Kolb D A.Experiential learning: Experience as the source of learning and development[M]. New Jersey:Prentice Hall,1984:20-38.
  [6] Neuendorf K A.The content analysis guidebook[M].London: Sage,2016:28.
  [7] 周翔. 傳播学内容分析研究与应用[M]. 重庆: 重庆大学出版社,2014: 13.
  基金项目:国家自然科学基金(项目号:71432005)。
  作者简介:孔祥年(1994-),男,汉族,山东省菏泽市人,上海交通大学安泰经济与管理学院管理学硕士生,研究方向为领导行为。
  收稿日期:2019-02-08。
转载注明来源:https://www.xzbu.com/3/view-14894422.htm