基于内容统计分析的档案定义研究
来源:用户上传
作者:于懿兰 程昕烨 陈斌 邹志鹏 梁春华
摘 要:为获得相对完整准确的档案定义,从中国知网、万方等全文数据库中采集来自学术专著、学术期刊、法律等的档案定义160条。分析档案定义构成要素,建立档案定义模型,按模型要素(形成主体、形成来源、形成条件、价值、载体、本质属性、实体)对定义进行统计分析,得出“档案是机关、组织、个人在社会活动中形成的,经鉴定、整理、归档、保存下来以备查考利用或作为凭证的,文、形、声等各种载体的具有原始性与历史性的文件材料”的结论。
关键词:档案定义;统计分析;内容分析
Abstract: 160 kinds of Archives concepts from academic monographs, learned periodicals and laws through CNKI, Wanfang Date Knowledge Service Platform were collected to define a relatively comprehensive and accurate Archives concept. Analyze the elements of Archives concept and establish the model of the Archives concept. The collected concepts were statistically analyzed according to the elements of the model, including subject, source, condition, value, status, essential attribute, entities, and then the Archives was defined that Archives is originality and historical documents which formed by organs, organizations or individuals in social activities, after appraisal, arrange, archive, preserved for the functions of certificate and examination or its proof function, with text, graphics, audio, video and any other vehicles.
Keywords: Archives concepts; Statistical analysis; Content analysis
1 引言
档案是档案学科中最基础、最核心的概念,是档案工作与研究中首先遇到且无法回避的概念,也是档案学理论研究的首要课题。对档案定义的研究,国内外成果丰富。在国外,谢伦伯格(美)、阿道夫·布伦内克(德)、希拉里·詹金逊(英)、迈克尔·库克(英)等提出的档案定义具有代表性。在国内,《档案法》《档案著录规则》中的档案定义,陈兆祦、吴宝康等提出的档案定义均为认可度高的权威定义。对档案定义的研究虽然丰富,但始终没能得出相对统一的观点。档案与社会生活联系紧密,定义档案通常从实践经验和理论总结出发,因此造成档案定义多样化、差异化。随社会实践和具体档案工作的开展,档案定义也在不断演变。因此,对档案定义的界定需要不断深入探索。
鉴于此,笔者尽可能全面地搜集了已发表文献中关于档案的定义,对其内容进行提取、统计、分析,发现档案定义的主要构成要素存在较大共性,因此笔者尝试以共性要素为基础建立档案定义模型,根据模型对定义中包含各要素的表述进行词汇与词频的提炼、归纳、统计、分析,以期获得相对完整准确的档案定义。
2 档案定义采样
以中国知网(CNKI)、万方等全文数据库资源为采样源,以“档案定义or档案概念”为检索关键词,查找学术期刊、学术专著、百科全书、权威词典、法律法规、学术会议等来源的档案定义,摘取文献作者所著档案定义共160条,摘取的部分定义如表1所示。
2.1 采样统计的可行性。所采集160条档案定义按发布年份的统计结果如图1所示。档案定义公开发表集中在20世纪80年代,其中1982年数量最多,原因在于,1980年国家档案局主办的《档案工作》杂志(现名《中国档案》)开辟“争鸣”栏目,开启了档案定义的大讨论,征集大量档案定义研究文章,辑录档案定义50余条于1982年汇总发布。90年代及以后,档案定义研究及定义发布呈收敛趋势。因此,通过内容统计分析方法归纳档案定义具有可行性。
2.2 采样统计的全面性和典型性。按来源统计,160条定义中来自法律法规的有5条,占3%,法律法规以各国档案法为主;来自标准的有4条,占2.5%,标准包含国标与行标;来自学术专著的有26条,占16.3%,专著包含国内外档案学者及档案学研究机构发表的论著;来自百科全书的有4条,占2.5%;来自权威词典的有16种,占10%,词典含规范性词典及档案专业词典;来自学术期刊的有99条,占61.9%,期刊以《中国档案》《档案学通讯》《档案》等档案专业核心期刊为主;其他来源6条,占3.8%,包括会议报告、学术会议等。
按国别统计,国外档案定义有24条,占15%,为各国提出的有代表性的档案定义,提出者包括希拉里·詹金逊(英)、迈克尔·库克(英)、阿道夫·布倫内克(德)等档案学者,也包括国际档案理事会、联合国教科文组织、美国档案工作者协会等机构。国内档案定义有136条,占85%,提出者为曾三、陈兆祦、和宝荣、吴宝康、丁永奎、冯惠玲、丁海斌、朱玉媛等档案专家学者。据以上统计分析,可认为采样定义具有全面性和典型性。
3 档案定义模型构建
已有研究中,定义方式以形式逻辑方式为主流,即“属概念+种差”的定义公式,属概念与种差共同构成档案定义要素。关于档案定义的构成要素,档案学者们进行了一定的研究探讨。 陈兆祦、和宝荣[7](1982)提出档案定义应包括“档案的来源”、“档案形成的一般条件”、“档案的物理形态”、“档案的社会作用及其主要特点”四个要素。金琦[8](1982)提出档案定义应反映6项内容:档案的本质、档案形成的历史条件、档案反映的内容、组成档案的物质材料、档案的思想内容、保存档案的目的。朱益祥[9](2001)提出,除属概念外,档案定义中还应体现出档案是人们在社会实践中形成的文件、办理完毕、凭证价值、需要保存的特点,这些特点即包含了“形成主体或来源”、“形成条件”、“价值”要素。
虽然目前档案学界对以何作为档案定义属概念,档案定义种差应包含哪些要素的问题的研究讨论仍在继续,但归纳起来可以发现,档案定义的构成要素可总结为以下7项:形成主体、形成来源、形成条件、价值、载体、本质属性、实体(属概念)。
形成主体指产生、形成档案的人或机构、组织,也可概括为形成人。形成来源指形成主体从事的活动,档案来源于这些活动,自这些活动中产生、形成、积累,档案的内容也是这些活动真实情况与内容的反映。形成条件指实体转化为档案所需的条件、经过的动作。价值指档案所能产生的作用,档案对其形成主体的存在意义。载体指记录档案内容的物质材料,是档案的展现形式。本质属性即档案的独有特点,说明档案的本质特征,使其区别于其他文献材料。实体是档案定义的属概念,是档案的定义项。
7个要素中,形成主体和形成来源是档案最初产生所必需的要素,形成条件是实体真正转化为档案所需的过程,价值、载体、本质属性、实体都是档案本身的特质。基于以上要素及要素之间的关联,笔者尝试建立如图2所示的档案定义模型,体现档案从产生到形成的过程与档案本身的存在形式与其所具备的价值、属性。
4 档案定义要素的统计与分析
笔者提取160条采样定义中关于定义模型中7个要素(形成主体、形成来源、形成条件、价值、载体、本质属性、实体)的表述,采用梁春华等(2016)在《基于采样统计内容分析的情报定义研究》一文中使用的聚类统计方式,对其词频、词汇进行统计与分析。
4.1 形成主体。形成主体,指产生、形成档案的人或机构、组织,也可概括为形成人。160条采样定义中,有132条中包含对形成主体的明确表述。对表述内容进行一次聚类后,发现关于形成主体的表述可分为三类:第一类表述较为具体明确,包含“国家机构、机构、单位、机关、社会组织、组织、个人、家庭、家族”,将此类表述进行二次聚类为“机关、组织、个人”;第二类表述宽泛概括,没有明确指向,在一些定义中被作为简称,包含“人们、人类”,将此类表述二次聚类为“人类”;第三类表述二次聚类为“人、事物、自然”,主体范围广阔。进行三次聚类得到“机关、组织、个人;人类;人、事物、自然”。进行四次聚类得到“机关、组织、个人”。如图3所示。
因此,将形成主体定义为“机关、组织、个人”。
4.2 形成来源。形成来源,可概括为“活动”。160条定义中,有127条含有档案形成来源的明确表述。进行一次聚类得到“社会活动、社会实践活动、活动、社会实践、实践活动、自身活动、改造自然界和社会活动、认识实践活动、思维活动、事务、法律性和事务性活动、工作、生产、生活、历史、历史活动、(人类)实践和(自然界)变化活动”等。进行二次聚类得到“社会活动;社会活动、思维活动;工作、生产、生活;历史;人类活动、自然界变化”。进行三次聚类得到“社会活动”。如图4所示。
因此,将形成来源定义为“社会活动”。
4.3 形成条件。形成条件指实体转化为档案所需要的工作或处理。160条定义中对形成条件有明确表述的有98条。进行一次聚类可得“经过鉴定、整理、立卷、分类、组合、归档、收集、保存、保存在归档机构、保存在特定场所、集中保存、办理完毕”。进行二次聚类得到“经过鉴定、整理、归档、保存、办理完毕”。如图5所示。其中“办理完毕”这一表述主要强调档案的非现行性特点,属于档案属性的部分,因此不在档案形成条件中列出。
因此,将形成条件定义为“鉴定、整理、归档、保存”。
4.4 价值。档案价值指档案能起到的作用。160条定义中有91条对价值有明确表述,对其进行一次聚类,得到“保存、持久保存、永久保存、备查、参考、查考、查证、利用、使用、有价值、永久价值、长久价值、长远价值、凭证、证据、研究、控制、社会、实践、实现目的、提供真实、相关、科学、遵循规律、重要、复制”;进行二次聚类得到“保存、查考利用、有长久价值、凭证、其他”,其中“保存”在“形成条件”中提及,为避免重复,不将“保存”列入价值要素;进行三次聚类得到“以备查考利用或作为凭证”。如图6所示。
图6 价值聚类统计
因此,将价值定义为“以备查考利用或作为凭证”。
4.5 载体。档案载体指记录档案内容信息或形式特征的物质材料,载体是档案展现形式。160条档案定义中有70条对“载体”有明确表述,每条定义表述中存在多个可提取的词语。将其表述内容归类整理后进行一次聚类,得到“声音、音像、录音带、录音文件、录音、照片、相片、照相、胶片、录像、录像带、影片、公文、笔记、个人文件、文稿、文书、文件、文件材料、文字材料、印刷品、文图声、文形声、文图影声、文字形声”等等。进行二次聚类得到“声像;文、形、声;其他”。进行三次聚类,归纳为“文、形、声等各种载体”。如图7所示。
因此,將载体定义为“文、形、声等各种载体”。
4.6 本质属性。“档案的本质属性是档案学基础理论研究的重要内容,是定义档案概念的基础,能否准确地揭示其本质,是评价定义优劣的根本。[10]”160条定义中有关于属性的明确表述的有35条。进行一次聚类得到“原始、真实、凭证、依据凭证、证据、书面记录、历史、历史依据、非现行、明确、科学、文化、完整、独一无二、必然联系、公务、固定”。进行二次聚类得到“原始凭证性、历史性、其他”。进行三次聚类得到“原始性、历史性”。如图8所示。 因此,将本质属性定义为“原始性、历史性”。
4.7 实体。实体,即档案定义中的属概念。目前,关于档案的属概念说法较多,王绍忠(1990)、张煜明(2002)等学者对档案定义属概念的主流说法进行了分类归纳,分类方式大体一致。因此,笔者参照已有分类方式对采样定义中的属概念进行分类与聚类。
进行一次聚类得到,“记录类”包含“记录;历史记录;原始记录;真实记录;信息记录;数据、信息和知识的记录”,“文件类”包含“文件、文件材料、历史文件、历史文件材料、原始文件材料、文件的组合、文件材料的组合、文件的总和、文件材料的总和”,“材料类”包含“材料、材料的组合、历史记录材料、文字形声材料、记录材料、信息材料”,“信息类”包含“信息、固化信息、凭证信息、原始信息”,“载体类”包含“载体、信息载体”,“写照和历史文化遗产类”包含“写照和历史文化遗产、历史真迹、史迹、真实写照”,“其他类”包含“实物、系统积累物、产物、知识、东西”。进行二次聚类得到“历史记录、文件材料、材料、文献、信息、载体、写照和历史文化遗产类、其他”。进行三次聚类得到“文件材料”。如图9所示。
因此,将实体定义为“文件材料”。
5 结论
通过对160条档案定义各个要素进行提炼、归纳、统计、分析,我们可以将档案定义表述为:档案是机关、组织、个人在社会活动中形成的,经鉴定、整理、归档、保存下来以备查考利用或作为凭证的,文、形、声等各种载体的具有原始性与历史性的文件材料。
参考文献:
[1]张煜明.关于档案定义的辨析与探讨[J].图书情报知识,1990(03):60-61+71.
[2]黄霄羽.外国档案管理学[M].北京:中国人民大学出版社,2017:25-28.
[3]宫庆新.中外档案定义研究述论[J].山东理工大学学报(社会科学版),2013(07):97-102.
[4]陈兆祦,和宝荣,王英玮.档案管理学基础(第三版)[M].北京:中国人民大学出版社,2005:10.
[5]吴宝康,丁永奎.档案学概论[M].北京:中国人民大学出版社,1988:32.
[6]冯惠玲,张辑哲.档案学概论(第二版)[M].北京:中国人民大学出版社,2006:6.
[7]陈兆祦,和宝荣.对档案定义若干问题的探讨[J].档案学通讯,1982(05):15-22.
[8]金琦.对档案定义的探讨[J].档案工作,1982(03):37-38.
[9]朱益祥.再论档案定义的界定——兼与持传统主流观点的同仁商榷[J].档案学研究,2001(04):53-56.
[10]王景高.檔案研究30年(之三)——关于档案本质属性的研究[J].中国档案,2009(04):52-55.
(作者单位:中国航发沈阳发动机研究所 来稿日期:2019-12-02)
转载注明来源:https://www.xzbu.com/4/view-15138537.htm