知网,知错就不改

距离上一次因涉嫌垄断被罚8760万元后,短短十个月,知网再次被罚。

9月6日,知网(CNKI)因违反必要原则收集个人信息、未经同意收集个人信息等多项违法行为,被网信办处以5000万元罚款。根据相关条例,违反个人信息保护法情节严重的,应处以5000万元或者上一年度营业额百分之五以下罚款。根据知网母公司同方股份财报,同方知网2022年营收为12.51亿元,虽然5000万的罚款不到营收的5%,不属于顶格罚款,但也算中等偏上程度。

作为教育信息服务平台,知网掌握着大量个人信息和多个专业领域知识,容易成为境外黑客组织攻击的对象,因此2022年6月24日知网被启动网络安全审查,而知网旗下的手机知网、知网阅读等14款App被发现存在违反必要原则收集个人信息、未经同意收集个人信息等多项违法行为。

其实,知网在保护个人信息上有纰漏早就有端倪。据央广网报道,手机知网2022年9月的隐私政策中明确指出,用户访问手机知网平台或使用手机知网服务时,系统可能会自动接受并收录用户浏览器、计算机上的信息。直到今年7月28日,更新的隐私政策中,日志信息一栏才没有提及浏览器、IP地址、电信运营商等信息的收集。

中国社科院财经战略研究院李勇坚认为,知网收集的用户浏览器信息与其提供的服务并无关系,可能会将其用来大数据杀熟。特别的是,很多企业没有充足的信息保护能力,在使用信息的过程中容易被黑客或其他犯罪分子攻破,这都会给个人利益造成很大危害。

在反垄断案的冲击下,知网创始人王明亮卸任两家知网系公司、裁员风波、高毛利不复存在。风雨中的知网,虽被打成了筛子但却还在躺赚。

知网,学术圈“视觉中国”?

每个学术圈的人都知道知网,没了知网,无论是写论文还是查重都会举步维艰。

李蓝蓝是2023级毕业生,今年毕业季,论文查重是她最关心的问题。她获悉知网查重很贵,其他软件不够精准。为了保险起见,为自己论文准备了400块一次的查重费用。然而,事情出现戏剧化的一面,李蓝蓝查重一次只花了不到20块。

知网的价格能变得人性化,多亏了赵德馨。2021年12月,一则“89岁教授向知网维权8年”的消息引爆互联网。原来是2013年时,赵德馨发现知网擅自转载了其160多篇文章,自己非但没收到稿费,下载本人文章时还需要额外付费。自此之后,赵德馨走上维权路,多次状告知网,最终获赔70余万元。

赵德馨并不是唯一被侵权的人。重庆大学新闻学院教授、博士生导师刘海明表示,“近几年我几乎所有的论文或者报刊发表的作品都被知网收录,大约有140篇。最多一篇论文,知网的下载量已超过2600次,但知网也没有主动联系我支付报酬。”

一方面靠极低的成本获取知识,另一方面又将知识数据库高价卖给受众。比如,用户在知网下载一篇博士论文,此前费用是25元/本,2021年才调至9.5元/本。一篇来自华东师范大学、名为《有效教学研究》的博士论文,被下载46884次,即至少可以为知网带来44.5万元收入。而知网支付的可获得的现金均不超过100元、同时不超过500元面值的知网阅读卡。

价格过高,也使得高校多次抵制知网。2012年12月,南京师范大学图书馆发布公告称,因知网涨价过高,将于2013年暂停使用。2016年,武汉理工大学也表示知网续订价格涨得离谱。根据公开信息,自2000年以来知网对武汉理工报价从2010年到2016年涨幅超132%,年平均涨幅超18%。武汉理工大学因此停用知网,以维护学校权益。

不光贵,收费标准还不统一。据凤凰网报道,广西艺术学院、广东医学院等高校在2012-2014年的采购金额仅为20万-30万元。武汉理工大学其知网采购价在2010年到2016年涨幅为132.86%,高于万方、维普、超星读秀等其他学术数据库。比如,2021年,合肥工业大学购买了中国知网、万方数据、超星读秀、维普四个数据库,其中知网的费用达到 82 万元,而万方数据不过24.8万,不到前者的三分之一。

此外,知网服务收费过高的问题也被翻出来,原因是之前的知网不开通个人查重,只对学校和其他一些有权限的机构开放,一旦超过免费次数,查重一次动辄可达500元/篇左右,这些尚无赚钱能力的大学生为了顺利毕业,花费上千元是寻常事。

2022年5月,市场监管总局依据《反垄断法》对知网立案调查。12月,市场监管总局依法作出行政处罚决定,责令知网停止违法行为,并处8760万元。知网也承诺对其不合理的措施作出改善。

知识做的是数字版权的生意,向内容创作者获取内容版权,将其集成到自有平台,最后再将数据库售卖给高校和机构,内容都来自学术界。理论上,学校和作者应该有更强的话语权,可为何演变到今天的境地?

从公益到百亿暴利生意

知网能形成今天的垄断地位,和20多年前学术界集体版权意识薄弱息息相关。

知网最初成立的目的是公益与分享,然而在得到了各项政策大力扶持后,最终背离创立时的初衷,成为无本万利的知识贩子。

知网创立于互联网在中国萌芽的前夜。在上世纪90年代,学生要想写论文,就得在图书馆翻资料,十分不便。看到这个情形,清华大学教授王明亮灵机一动,想要开发一款数字化图书馆,这个提议得到了清华大学的帮助,1997年,中国学术期刊电子杂志社成立。

1999年,在世界银行提出“国家知识基础设施”概念不久,嗅觉敏锐的王明亮顺势提出了建设中国学术知识的网络平台,并制定了《中国学术期刊(光盘版)检索与评价数据规范》。幸运的是,得到了新闻出版总署的背书。也就是说,任何一所高校想让自己的图书馆论文检索系统联网,就必须遵循这个规范。

彼时,各大高校交流学术资源的途经主要靠学者访问,王明亮的提议,犹如久旱逢甘霖,给知识分子提供了一个更广阔的学习平台,于是纷纷献上学术资源。就在这一年6月,互联网在中国兴起,中国期刊网站(CNKI)即知网前身终于正式上线。

据南方周末报道,1997年时,知网已经有2600多种期刊入编,1999年,达到了3500种期刊,短短三年时间基本完成了对顶级学术资源的“收编”。期刊能乖乖交权,国标背书只是一方面。

另一方面,也是因为学术界对于知识版权的认识尚浅。虽然最早接触数字产品,但为了“传播”一开始就主动放弃了数字版权,将市场化交给第三方。甚至到2006年,学术期刊为了稿费,还发起了独家授权,让知网一家独大。

据媒体报道,2006年时,每家期刊版权费大约是三千元每年,哪怕学者多合作几家,稿费封顶也在一万元左右。正是这一年,十几家高校为牟取更高的数字收益,共同跟知网谈判,将独家授权价格谈到了第一年三万,第二年三万五,第三年四万,五万封顶。而对于期刊的版权,有这样一条规定:合同期满5年内,知网仍享有合同规定的所有权利,满五年后,仍享有非独家使用权。

看起来是“丰厚”的薪酬,但以长远视角看,本质上只需要一次性支付廉价稿酬,买断期刊论文的数字传播版权,其实并不合理。

期刊之外,另一大学术资源是博士、硕士们的个人论文。博士硕士论文虽没有签约独家版权,可知网凭借国家背书实现资源的聚集。知网是中国唯一拥有国家批准标准刊号、正式全文出版的国家级博硕士学位论文数据库。很多单位规定的职称评审和晋升中,论文引用数是一个重要条件,而能够带来官方学术引用数的,只有知网最为权威。

有了国家与学校的认可,知网有了拟定霸王条款的底气:想在平台发论文,就得签订《论文使用授权书》。很多青年作者担心传播度,并放弃了争取正当权益。至此,知网实现了期刊到论文的垄断。截至 2020 年底,知网累计收录的文献量已达 5191万余篇,其中,核心收录期刊收录率达到了99%,成长为学术资源的巨无霸。

知网狮子大开口也离不开“翟天临”们的助推。2007年以来,学术造假现象猖狂,国内高校开始将毕业论文的查重通过作为强制要求。坐拥最多学术资源的知网遂开发出查重系统,即学术不端论文查重系统,因为资源上的优势、其科学算法也使得论文查重结果具备权威性,被高校广泛认可。自此知网逐渐背离初心,向学校与学生漫天要价。

谈及涨价理由,知网给出的解释通常是数据库资料增加,采购价上涨。但事实上,知网的生意实属暴利。中国知网的主体是同方知网,是同方股份的子公司。虽然在同方股份庞大的业务中,知网的营收占比只有不到5%,但毛利率却名列前茅。根据财报,同方知网2006年营收为2.74亿元,当年毛利率为48.5%。2021年营收增加到17.52亿,翻了6倍,毛利率为53.53%,甚至2011年毛利率一度达到72%。

在2012年时,知网推出了查重系统,或许是研发成本的上升,2012年知网的毛利率降到66.9%。为了拔高毛利率,知网的方式是加快涨价步伐,按照武汉理工大学的说法,知网2012年报价涨幅高达24.36%。南京师范大学图书馆率先发公告称,CNKI中国知网数据库商家涨价过高,决定2013年开始停用。从财报数据看,2013年知网毛利率又重新回到71%。从图表就可以明显看到,在除了反垄断立案的2022年,知网毛利率一直维持在50%到70%之间。

这又是什么概念呢?拿一些公司对比可明显感知,以科技与创新著称的苹果公司毛利率也不过45%。以高毛利率著称的企业也很难和知网相比,蒙牛约30%-40%,农夫山泉约为55%,雅诗兰黛约为40%左右。作为论文的搬运工,知网靠学术界的隐形权利,轻轻松松敛财。

学术老大地位开始松动

被处罚后,知网随后发布5大方面15条整改措施。对于此前饱受诟病的独家合作模式,知网表示,一是推进行业非独家合作模式,积极倡导并主动推进行业放弃独家授权权利。二是解除独家合作协议,停止新签续签独家合作协议,积极主动与期刊、高校协商尽快解除现有独家合作协议。

独家合作协议的模式被打破,知网受到冲击。据知网工作人员透露,知网的数据库业务被同行如超星、万方、维普抢走不少,但因还没有公开信息,所以具体数据我们目前还无法得知。

对于昂贵的数据库服务,知网称会降低销售价格,用户的学术文献数据库服务实际成交价格三年内下调30%以上。目前来看,数据库服务的价格调整还不算明显,据红星资本局报道,部分高校采购知网数据库的价格有所降低。2023年6月,大连民族大学中国知网数据库中标价格为96万元,而2022年为105万元,下降了9万元。但中国人民警察大学,2023年和2024年度的知网数据库采购价格就没变化,都是44万元。

而查重业务的价格已经有了明显变化。2022年6月,知网向个人提供查重服务,价格为1.5元/千字。相比较,以万方、Paperpass为首的查重服务,定价均在1到3.5元每千字。据新熵了解,知网查重所说的1.5元每千字,其实并不是看字数,而是看字符。也就是说,2万字的论文,上传到知网也许会激增到4万字符,原本只需要花20块到最后却要付70块,这点也有学生党在抱怨太贵。总之,查重问题还有改进空间。

收入少了,知网无法维持暴利。

根据2023年上半年财报,同方知网主营业务收入约4.97亿元,同比下滑6%。毛利率仅为26.60%,2022年上半年则为41.97%。归属于母公司的净亏损为6010万元,去年同期的净亏损为1280万元。考虑到还要计提罚款,预计知网净利润将继续承压。

处于风暴中的王明亮,也开始退居幕后。在反垄断立案之前,王明亮一直担任知网相关的四家公司的董事长。涉垄断立案调查后不到一个月,同方知网(北京)技术有限公司、同方知网数字出版技术股份有限公司法定代表人、董事长、经理由王明亮变更为刘长欣。而北京清华同方知网信息服务有限公司则已注销。王明亮目前只是《中国学术期刊(光盘版)》电子杂志社有限公司的法定代表人、董事长。

接任者刘长欣来自中国核工业集团,2019年底,知网母公司同方股份的控股股东变更为中核资本。截至2023年3月,中核资本持有同方股份30.11%的股权。中核集团是核燃料生产商,和知网的知识版权生意并没有多少相关性。目前有关刘长欣的资料也寥寥无几。

创始人离任、垄断的结束并不代表知网的地位一时就能被颠覆。

知网靠高密度信息+政策利好建立起的垄断模式,哪怕破除不平等条例,竞争对手想要超过也需要时日。财经新知在中国政府采购网平台上搜索发现,近半年内采购知网数据库的高校或机构为14家;而万方数据库、超星数据库只有1家,知网20多年积累的内容资产不是其他平台一时半会可以超越的。

但知网在完成了原始积累,成就了一定规模且获丰厚利润之后,仍无视作者的权益,放任侵权行为的发生,那就是知网的不对了。

我们无法想象,在数网时代,一个拥有世界一流学术期刊集群的国家,其学术期刊出版竟然需要在两类互不统属的出版机构中先后走一遍,前一类机构数量众多,但一家只出一两种刊物,还在以纸本为中心操作,数字出版则要交给另一类机构来做,而当期刊从后一类出版机构走出来时,已经不是面目全非,而是无面无相了。期刊连形象都没有,如何称得上世界一流,如何参与国际竞争,又谈何为中国赢得学术话语权。