您当前的位置:主页 > 招人才 >
招人才

用小猿搜题学习宝这类产品是否真能搜到题

2019-12-02 14:50:20

先说结论1,没有一家超过90%的,没耐心的可以直接看下面那张表!2,不要给我发私信再测试了,我不是职业测试的。或者,也可以给我份工作?3,有兴趣的可以直接下载图片再来一遍!好像小猿也开始封号了(反应挺快),大家抓紧!声明第二版:被下面BB的烦了,再来解释一遍关于测试逻辑的:没看懂就不要吓BB,什么叫随机图片?看懂我的测试逻辑了吗?任何为了测试进行拍的照片是没用的(没有数据代表性,没有行为代表性)最接近的照片是来自作业帮这样的本来就是学生拍照答疑需求的图片(提问的题目来自真实学生需求,图片来自真实学生图片),你看懂这个逻辑了吗?关于OCR准确度的问题:下面怎么一堆的傻逼认为OCR的准确度到了95%了呢?你们哪里来的信心?你们懂版面分析吗?懂归一吗?懂单字识别和整行识别吗?学过RNN&CNN吗?有多层神经网络的训练经验吗?OCR真的只在公式问题上出问题了吗?汉王&文通的技术源头是谁清楚吗?看懂最后两张照片我为什么夸奖吗?这件事情这么好做,我所在的公司会不做吗?会放给百度IDL吗?(说明,确实是小号,利益主要是我是识别公司的员工,学霸君和猿题库的识别超过了我的认知,最起码完成了大规模真实环境数据标注训练后的结果,当然这是我猜的,这得烧多少钱啊!)再次训练问题:请小猿搜题,学霸君,学习宝,题谷不要再来私信我在测试了,你们每个人都觉得自己数据低了!我说的只是在那一时刻的事实,不对以后什么负责!你们自己能测试,我已经把我的测试逻辑说的很清楚了!还是那句话,测试逻辑在这里,App在这里,图片在这里。Youcanyouup,NocannoBB前段时间看到小猿搜题的找了花花打了个广告,加上这几天学习宝宣布融资2000万刀(2000万刀啊,什么概念啊!),看了下新闻,之前还有个叫学霸君和快乐学拿了500万刀,这都什么产品啊?现在动不动都可以拿几千万了是哇!这几个都是做针对中学生的拍照答疑的,而且居然每个都号称可以达到90%以上的搜索搜索成功率?瞬间开始不信了,选了个周末,一定要拿出来测一下,决心戳穿你们的画皮!正式做评测之前扫了一下,乖乖,除了上面这几个,做答疑的还不少嘞。初步看了下分成两类:第一种就是人问人答:类似作业帮,爱考拉这类的,同学们拍张照片上去,等其他人来答,基本就是百度知道(作业帮就是百度的)这类产品主要考验有多少人愿意答,后来测试的时候几个平台发了一下,20张照片发上去,半小时过去了只有2-3题有人答,所以基本就是死的!作业帮晚上的时候还会告诉你今天多少人解决了问题,估计也就是20万以内的数字,看起来和他宣传的几千万用户不符合啊!腻们可是大百度啊!第二种就是人问机器答:怎么会人问机器答呢?我稍微研究了一下,基本原理就是先把拍的图像转化为文字,这步技术叫OCR(但是有人叫STR,搞不清楚,但是意思差不多),然后拿这些文字在搜索引擎里面搜,找到题目就返回给同学。这里面有两个事情比较重要,一个是那个OCR,或者是STR,另一个就是要有很大的题库,算是有点技术含量的!这样分好类之后剩下的就只有,小猿搜题,学习宝,学霸君,360,题谷啦下面一个问题就是到底多少测试样本才是OK的呢?可怜我做码农也已经4年了,初高中的书早就还给老师了,可怜我做个测评而已,不会还要我去书店买书吧,亏不起亏不起啊!还有的问题样本的多样性的问题,我一个人的拍照技术不能代表全体吧,再说,要测无论如何要测个几千张照片吧,我一个人拍真的会拍死的!不对,刚才不是有人问人答产品作业帮吗!这上面有大量的用户的真实照片啊,直接用这个就行了啊!解包,反编译,招到接口,模拟器跑接口,设置为隔5秒取一张,共计取得照片8000张(这样总有代表性了吧)我已经把这些照片上传到百度云,有需要的可以自行下载,这里是地址http://pan.baidu.com/s/1hqgnclI就在我刚准备把所有的照片全部扔进去开始测试的时候,钛晶狗眼突然被这张照片亮瞎了!这是什么,纳尼?自拍照也算问题吗?再看一下,好吧,这算是问什么题目没办法了,不得不对全部八千张照片做个人工识别了。。。即便作为人类,我也不觉得能明白你要问什么?这样模糊的,我人眼都看不清楚,就不要为难机器了!另外,这种拍一张的卷子的我到底要不要打死呢?最后稍微有点纠结的是手写和作文题(真的有直接拍道作文题的)考虑到除了小猿搜题外,其他明确不支持手写同时,除了学霸君外,其他明确不支持作文搜索。所以决定单独测试所以这八千张照片剔除了,非题目(自拍照),残缺题(随手拍),过模糊(人类看不了),多题(一张卷子),手写和作文题目后,还剩下7730张这个时候,我突然开始同情起这些App了,因为我把同学们这些照片都纳入到测试范围了下面,让我们就开始吧小猿搜题比较简单,拆包后接口相对清楚,所有传输都是明文的(安全性啊,安全性),截获上传图片的url:http://yuansouti.com/android/images和搜索结果的url:http://yuansouti.com/android/search。直接调用就可以了,设置了40台模拟器,每1分钟发送一次请求(怕太频繁会被封),很快就传输完了,根据返回的参数imageId判断,全天的提问请求应该在10~20万次学习宝也不复杂,因为有账号体系,所以能很清楚的看到分配的账号命名规则,传输也是明文的,目前应该在3-4百万注册用户,也不会限制请求,但是在传输到一半的时候,服务突然停止了,半个小时候才完成的!从返回的FID来看,全天的提问请求在80万-90万次左右,看来已经超过作业帮啦!学霸局比较麻烦,解包以后发现做了大量的代码混淆,手法看起来非常白帽子化,反编译也无法找到明文信息;截获上传图片url:qiniu/upCallback,获得答案结果url:http://xueba.com/getResult,可以用这个对上私钥系统。另外麻烦的是服务端做请求过滤,时间频次长达3分钟,另外好像一个账号超过200题/日的提问就直接封号了!(这个太过分了!你怎么能断定没有小朋友要问201题呢?)害的我不得不构造了40个手机账号用于申请账号,最后花了整整四个小时才搞定。学霸君返回的FID也比较奇葩,居然是700多万,难道学霸君一天有700万题请求?360一开始很顺利,但试了3000多次后直接被封网段,而且等了两个小时也没解封,换代理也没用,似乎是封物理地址的!果然够安全!题谷解包很简单,但是架构比较挫,我测试四十台模拟器,同时发了一张,居然挂掉了,难道没有承受过这个量级?数据出来了,我却抓瞎了,怎么判断是否命中呢?除了一部门返回为空的结果可以直接划断外,所有有返回的怎么验证呢?最后实在没办法,我只能又花了额外的四个小时一提一题的检查了一遍,结果如下成功证明,没有一款的App的搜索准确度超过90%,最好居然是学霸君,但也只有87.4%,小猿搜题第二位68.3%,学习宝只有52%,360也没好到哪里去,49%,题库最惨,只有40%。。。尽管证实了我的语言,没有达到90%,但是这个叫学霸君的还是比较震惊到我的。还记得上面那张很模糊的照片吗?这个明显出现运动失焦模糊,天知道他怎么做到,反正搜出来了!有哪位大神了解其中细节的!请介绍一下。不知道为什么,做完这个测试后我开始有点佩服做学霸君和小猿搜题的那几个哥们了!希望你们越做越好,看起来你们真的搞出了不少东西,早日兑现你们承诺的90%不要给我发私信了,我不是职业测试啊!这么多厂家找我测试,要不给我份工作?

上一篇:有什么讲共享经济的书推荐
下一篇:有什么学习数学的好网站
分类浏览
推荐文章
就目前而言,相关研究和已经投入使用的网站、确实不少,在安卓应用市场和苹果的都可以直接搜索安装。我就提几个个我比较熟悉的相关网站或。能够较...
最新文章
  在日前针对于简历送达做的网上考察显示,网上送达以利便、机遇多跟经济等上风被以为是做有效的求职渠道。但是怎么制造含金量高的简历呢?面试...