网络题库,拯救在线教育?

在双减之下,在线教育遭遇严控之时,网络题库似乎成为了最后的救命稻草。

但稻草能用吗?

文|张书乐(人民网、人民邮电报专栏作者,互联网和游戏产业观察者)

低端的网络题库都在赚钱,高端的App却在烧钱。

这不是一个笑话,至少对于当下题库类网络服务来说,现状就如如此。教育从业者程榕对时下的各种网络题库并不看好,“上个月曾经为学生出了一套高考真题,结果无意间在某网络文库里看到了,还是付费下载的。”

程榕并不是第一次遭遇这样的情景,但在文库平台上按了“举报”键后均泥牛入海,也就只能算了。

“高考或其他各种与升学、升级和升职有关的考试真题,往往是网络侵权的重灾区。”程榕无奈地说:有一次,有文库和我联系时甚至说,我出的是题目,也不是完全原创,有用户在平台上传了内容,还有很详细的内容解析,反而有了版权……”

在另一个层面,比起靠下载赚钱的各种网络题库、文库,那些走教学辅导路线的题库类App却还在烧钱之中。毕竟,比起原创更昂贵的还有技术和推广成本。

考试题解,到底有没有版权?

高考前后,一场关于4年前高考试题的版权官司再次审结,正好蹭上了热点。

2017年,深圳某公司对“2017年全国统一高考数学试卷(文科)”进行全面解析,推出了《2017年全国统一高考数学试卷(文科)(新课标Ⅰ)》,并进行了作品著作权登记。此后不久,该公司发现在某文库网站可以下载阅读该高考试卷解析,遂以著作权受到侵犯为由诉至法院,索赔1万元。

有意思的是,一审法院认定涉案文档构成著作权法意义上的作品,认定。而深圳中院认定,涉案文档不构成作品,撤销一审判决,驳回诉求。今年6月,深圳中院再审判决:二审认定涉案文档不构成著作权法意义上的作品有误,应予认定为作品。

关于试题及解析是否构成作品的问题,一直以来就很纠结。仅就考试试题为例,学界观点就分成完全对立的两面:

其一是考试试题属于法人作品,考试的主办方是著作权人,有权限制他人以盈利为目的使用其作品。

另一种观点则认为,考试试题属于《著作权法》当中规定的作品,但如高考、公务员考试等公共考试试题,属于公共利益,且与著作权人个体利益存在重大矛盾,法律不应对其财产权给予保护。

在互联网从业者张翔言看来,上述纠结都不成为问题,甚至于版权所有者认为的费时费力且维权所得颇为微薄,也不是关键。“很多网络题库都在使用避风港原则,让版权方的诉求,最终变成删除了事。以至于盗版者肆无忌惮,且来钱容易。”

在上述高考题解析判例之中,恰恰其审结的结果,尽管认定为作品,却也认为涉事平台符合网络服务提供者免于承担赔偿责任的条件……

这一结果,同样让题库平台的侵权问题,成为了一个打不开的“纠结”。

在7月的另一场类似案例,同样也没带来解决方案。

在该案中,上海某公司于2015年3月创作完成相关行业操作工网上培训平台题库,并于2018年7月完成了作品著作权登记。2017年该公司2名员工私下设立网站,复制上述题库作为该网站的后台题库并销售牟利,最终被检察院以侵犯著作权罪提起公诉。

但该案特殊之处在于盗版路径清晰且止损易于达成,加上“内部人”所为,整体案例反而对于解决盗版题库难题,并无实质用处。

题库大数据,正在批发懒人?

对于赵严来说,盗版题库和她无关,但主流的题库类App,却让她有些伤脑筋了。

作为一个小学二年级学生的家长,用搜题类App成为了每天晚上辅导孩子功课的首选。“主要是为了偷懒。”赵严称,可每次总能搜出正解的应用,也经常出“故障”。

比如一道数学题,搜出来的解答方式有3种,都很标准,可全部都是方程式的解法。“二年级的孩子没学过方程式,他们要用类似奥数的快速解法。”赵严说,显然,追求最优解的搜题应用,把它看做高年级数学题了。

此外,在陪孩子做口算训练时,赵严往往也会偷懒用拍照功能给孩子做检查,“偶尔也会出现识别问题,特别是把错误地看成正解,让孩子有了侥幸心理。”

尽管,在搜题类应用发展的初期,也曾存在侵权现象。

如在2015年,百度手机助手在官微里通报,某应用因涉嫌抄袭百度知道的内容,根据开发者相关协议,在多个应用市场予以下架。

随着时间推移,这一问题已经解决。搜题类App大多数采取各种老师以众包的形式进行解答,再采取类似问答平台的机制,优中选优。

“结果,高年级的遇见低年级题目,自然会选择更标准诸如方程式的解法作为最优。”程榕解释道,久而久之,选的人多了,就不可逆了。

但作为工具,搜索到正确答案的绝对性也并不确定。

在2016年,有媒体记者曾测试一道奥数题使用三种应用,却给出了不同答案。“这种问题过去确实存在,现在则不会发生。”某热门搜题应用的员工表示:但大家所宣称的9成有解,却很虚妄。别说主观题未必有标准答案,就是数理化这样近乎标准的题目,也会有许多新出现的题目未被及时收录,而无解。

当然,大数据式的题库分析和优选模式,整体来说是有效的。猿题库的联合创始人帅科就表示,在应用上,一道题可能练了几十万次,它产生的数据在大样本量的情况下,可信度会很高;像题目难度,在传统的出版社,教学机构,对题目难度的评估是非常重要的指标,但只能凭老师经验。通过用户数据分析,我们就知道推送什么样难度的题目是最适合用户的。

类似的,作业帮、学霸君也大多采用类似的大数据法则,最终形成搜索引擎和内容分发平台一样针对个体用户的数据优化。

然而,在舆论层面,关于此类搜题应用培养懒学生的抨击也时有发生,一些学生通过应用找到标准答案完成作业,结果考试失利,确实也是一种既成事实。

“当然,这肯定是极少数。”程榕认为,这就是个工具,在不同的人手中用法不同。

从工具到私教,难度有多大?

没有一个有理想的网络题库,想被当成工具。

靠单纯用户上传文稿来牟利的文库,题库不过是其销售的一种内容,作为工具挺好,盈利模式也清晰,但也不会对盗版有更多的管控欲。

对于猿题库、作业帮、学霸君等题库类App,则正在意图洗去题库和工具之类的关键词,进阶到和在线教育平台相似的状态。

较之学而思、新东方等网课平台而言,题库类App的最大杀器是用户画像——一次次搜题,形成了学生的用户画像、知识结构图谱,以及在画像背后的对细分知识点的刚性需求。

数据库有多大。仅以小猿搜题为例,截止到2019年12月27日,该应用共发生了86亿次搜索行为、覆盖近2亿题目;平均每天解答至少2347万道题目。“相当于427名老师不吃不喝、不眠不休解答一年。”小猿搜题负责人如是说:50毫秒古诗文背诵AI识别判分、对英语作文这样主观题目的智能识别……人工智能也在广泛的应用进来,试图最快捷的和用户进行答题上的深度契合。

作业帮也同样不甘示弱。2019年10月,原旷视科技技术副总裁罗亮加盟该应用。而作为国内人工智能最顶尖存在之一的旷视科技,其最出名的就是计算机视觉,并成为了科技部首批“国家新一代人工智能开放创新平台”。作业帮想要罗亮在拍照搜题之上进入更深层次的人工智能分析应用的图谋,显而易见。

然而,在付费领域,大数据却并无太多用处,反而是挖掘用户需求的小数据和画像,还没起到作用。

题库类应用所采取的付费的学习功能本质上仍是在线答疑、在线听课,和各大辅导机构力推的在线课程或学习APP相比,在价格、课程系统性、个性化学习方案上并无明显优势。

“尽管能够精准地给用户画像,并且找到其学习上的问题,可私教却很难达成对其问题的解答。毕竟题库的错题分析,已经给出了问题的最优解,私教点对点辅导也不过就是重复一遍而已。”长期在教学一线的程榕就指出:因此,看上去很美的差异化,其实本质上是无用的。反而,由于搜题解答,而且习惯了免费,题库App反而很难让用户为此具体问题解析付费了。

让其快速拥有用户和黏性的工具用途,此刻反而成为了让题库类App在付费功能上“难看”的双刃剑,或许这是其此刻最想解开的生死“纠结”了。

刊载于《创意世界》2021年4月刊