专访白描陶新乐:做高品质又便宜的扫描识别 App,背后是开发者的浪漫
开发者,是移动互联网生态中不可忽视的中坚力量,他们坚韧不拔且极具勇气,他们坚持正确的价值观,并坚信创新能够创造价值。
AppSo 也一样,我们希望那些具备可贵品质的开发者们,和他们带着闪光点的产品,能够被更多人所看见。
AppSo 每周都会邀请优秀的开发者,和他们聊聊在开发产品的过程中,那些有趣动人的故事。
在我们每个人都会遇到的难题中,其中就有一件是——图片转文字。将图片中的数据、文字导出加工,这在几年前可能会难倒很多人,要不是工具太贵,就是识别的结果质量太差。
但随着 App 市场的开拓,好用的识别翻译工具便诞生了,这其中就有陶新乐开发的《白描》。《白描》目前拥有 200 万用户,除了较高的准确率和不高的定价,它的校对及更多编辑功能,对学生党、文字工作者来说,都有很高的实用性。
今天,我们请到了陶新乐,让他和我们聊聊他的产品观及开发 app 背后的故事。
认识陶新乐
独立开发者,之前在北京工作,就职于国企担任高级研发工程师,因为不想和女朋友异地,遂辞职成为独立开发者,目前的主要产品有白描、两个西柚、西江月、白描取字、晓时。
白描注册用户突破 200 万了,有没有想到过会取得这样的成绩?
开发的时候是完全没想过的,最开始开发的时候就是为了给女朋友做个能识别纸质书上的文字用来记笔记的软件,做完了之后发布到 App Store 也是职业习惯,没想到发布之后会非常受欢迎,坚持下来获得了现在的用户规模。
在你心目中,会给白描打几分?
满分 10 分打 8 分吧,扪心自问,白描无论流程的设计还是实际功能的实现,都在这个领域做到了自己的特色和稳定出彩,也才能获得众多用户和各平台的肯定,比如小米市场的金米奖、豌豆荚设计奖、OPPO 应用时刻以及 App Store 的首页推荐等。
当然,仍然有一些功能排在计划中继续完善,比如公式的识别、PC 端的开发以及对疑难图片的识别如何更准确等等。
用一句话介绍一下白描及其轻量版吧。
白描是一款多平台通用的 OCR 识别与文件扫描工具,能高效完成文字识别、表格识别、长图识别、文件扫描、图片合成 PDF、色彩切换、批量处理、翻译等需求。
白描取字是白描的轻量版,专攻文字识别、批量识别、翻译等需求。
全职做独立开发后,为什么会首先想到开发白描?
完全是一个偶然,谈话间出来的产品灵感。
女朋友常做读书笔记,使用了当时市面上的文字识别软件觉得有的识别流程累赘,会员也太贵,免费的识别结果又不好,于是就想到自己能给她做个用得爽的 OCR 识别工具,并且很快付诸了行动。
▲ 图片来自:unsplash
在当时的条件下,开发具有 OCR 功能的 App,你遇到过哪些挑战?
主要挑战就是,自己从头完全做自己的识别引擎几乎是不可能的事,于是研究了市面上可以提供这个服务的厂商的产品并进行对比,尝试了各种图片各种情况,找出目前效果最好的那个。
白描的使用场景有哪些?它的哪些群体用户最多?
场景蛮多的,比如上课拍 PPT 提取文字记笔记、把纸质合同扫描成电子版并且可以制作 PDF、把纸质表格转成 Excel 电子版、翻译图片上的文字、老师可以用来拍试题识别之后对试题再加工、律师用来提取纸质文书上的文字等。
从用户反馈来说,文字工作者、学生、律师常常会用到白描。
▲ 图片来自:unsplash
图片转文字也会有失误,你是如何弥补的呢?
在识别之前,我们会进行一些技术上的处理,保证图片的清晰度,让它更易于识别。
在识别之后,白描的校对功能,能让识别结果与原图显示在同一个界面,用户还可以找到需要修改的地方,在此基础上进行编辑。
你是怎么优化白描的识别功能的?
想了一下主要有以下几点:
- 图像压缩,保证清晰度又尽量减小图片体积;
- 波纹过滤,有些时候拍电脑屏幕会有一些干扰波纹,这些要优化掉;
- 长图自动裁剪,检测到长图的空行位置自动裁剪开,不会裁到文字;
- 去除杂乱背景,有些纸比较薄的情况会透出背面的字影响识别,用户可以切换色彩去掉那些干扰因素;
- 自动分段,针对文章进行了自动分段,更易于阅读;
- 自由选区识别,很多人有识别多样化排版的文字需求,比如报纸那种排版,东一块文字西一块文字,可以使用自由选区的功能,把需要识别的部分画出来,白描就会按照画的顺序去识别了。
白描除了可以识别文档,还可以扫描证件,你是如何让它变得更智能的呢?
主要是自动检测边界,因为在扫描的时候避免不了裁剪与矫正,我们尽量做的更自动化,当然检测边界的准确度还有很大的提升空间。
另外,在后期的规划中,我们会让白描判断证件类型更智能,扫描的时候就判断出扫的是身份证,还是营业执照或者其他证件,进行更有针对性的后续操作。
白描需要多久维护或更新一次?
大功能的更新可能在两个月一次,其他的如果遇到紧急问题就要尽快更新。
你是如何建立良好的用户反馈机制的 ?
目前主要通过邮件和白描的公众号反馈,基本能在 6 个小时内回复并处理用户的邮件和公众号留言。
你觉得在 OCR 识别、翻译与扫描这块,白描为什么能获得好评?
第一是流程更简单,打开就直奔主题;第二是识别准确度确实比较高,因为目前市面上的识别引擎有很多,白描用的是最贵的高精度的那种;第三是价格合理,性价比高,很多同类型的 app 都是订阅制,一年几百块,而目前白描最高级的会员才 30 块,而且是永久的,关键是识别效果更好。
▲ 图片来自:unsplash
白描之后,你还开发了两个西柚,这个想法是如何产生的?
这个想法依然来自于女朋友的需求,因为做独立创作需要自由高效地安排和记录时间,目前市面上的时间管理软件,她用的都不是很顺手,于是她就自己设计了一个。当然,刚认识她的时候,我就想为她做一个 app 来推送她的作品,她真的很有才华。我也没想到最后可以这样曲线救国地实现了我的愿望。
用一句话介绍一下两个西柚吧。
两个西柚是一个帮你与时间相处的时光记录者,集日程安排、待办提醒、日记于一身,还有那么一点与众不同的美感 —— 充满故事的氛围音乐和每天新鲜更新的壁纸。
它是由你和女朋友白灵筠一起完成的吗?
是的,产品设计、UI 设计全部都是她做的,我只是敲代码实现。
两个西柚除了时间管理的功能好用之外,最大的特色就是它还有自己的内容 —— 每日更换的壁纸和不断更新的氛围音乐,这些壁纸完全都是女朋友原创,包括摄影、绘画,每个周都要为此专门画一幅画。氛围音乐和日程提醒铃声也完全是她自己创作的,她弹琴,去外面收集一些大自然的声音,还写下当时发生的故事,放在两个西柚里的每一首氛围音都有它的故事。
▲ 图片来自:unsplash
从有想法到 App 上线,用了多长时间?
这个还蛮久,得一年多。
两个西柚开发起来困难吗?
开发上的难度其实并不是最大,主要是逻辑上要想的更完善,想做到把她想要有的功能集于一个 app 上而并不显得繁琐,她会把功能都设计好,要说难度其实主要是内容的坚持,比如去收集声音,坚持每天更新壁纸,这是一种 「甜蜜的负担」。
两个西柚拥有日记和待办工具两种功能,和市面上的 App 相比更文艺和另类,你们是如何「教」会用户使用的?
目前还没有教,更多的是靠用户自己去探索和发现,能做的就是让 app 更易用,以人为本,上手就会。后面也会考虑加入一些引导,解锁更多使用小技巧。
点击这里,查看 AppSo 对《两个西柚》的测评。
你们在这款 App 中埋下了哪些彩蛋?
比如 App 的名字,两个西柚,就来自 I want to see you(我想要两个西柚 / 我想见你)的梗,是一句情话(羞涩)。
其实还有一些好玩的彩蛋啦,比如在某一个氛围音的介绍里提到了白描。比如点亮当天的壁纸会获得两个西柚,也蛮期待用户自己发现更多埋伏在细节里的彩蛋的。
你们有计划开发两个西柚的 Android 版本吗?
有计划,但是目前还没有精力,因为 iOS 版本后面还会有一个比较大的修改。
还有哪些 App 是你们一起做出来的?一起做 App,你们最大的感触是什么?
目前已经有成品的就是白描和两个西柚啦,接下来还有几款在想法碰撞中,目前刚讨论出了名字图标和定位。
一起做 app,我们刚好都可以做自己更擅长的部分,就感觉这是 「全天下最完美的阵容」,能够跟女朋友一起为一个产品付出,也是非常珍稀的体验。增进感情,及时了解对方的想法这些都是副产品了。
白描、两个西柚在 iOS 13 下运行如何?接下来会考虑加入深色模式吗?
目前在 iOS 13 运行都正常,白描的深色模式已经适配完成,近期就会发布,还在考虑两个西柚是否需要加入深色模式。
再介绍一下你的其他 App 吧!
第一是「西江月」,一款诗词软件,每天遇见一首诗 / 词,让你不经意间可以读一下。其次还可以根据分类查看诗词,可以搜索诗词,可以收藏诗词。这个 app 的界面非常简洁,略带一丝古风,非常适合喜欢读诗的朋友。「西江月」也是 App Store 推荐常客。
另一款是「晓时」,一款世界时间查看的软件,可以看不同城市的当前时间、日出日落以及在世界中的位置。
如何让用户更喜欢你的 App,这种亲切感是如何建立的 ?
用户的心也是肉做的,非常敞开地面对用户的反馈,并且及时交流,把结果反映在产品的进步上。另外就是在产品的细节部分加入一些个人化的心思,用心了,用户会感觉到的。
如何判断自己的长处,并与行业结合的?
耐心和同理心,据说是打动女朋友的地方,在做 app 这件事上也同样需要,能够站在用户的角度去思考问题,产品从一个个人想法到后来被越来越多的人使用,没有特别顽强的耐心真的做不到。
你觉得目前 App 市场还存在哪些机遇和挑战?
机遇我觉得就是,做一个 app 越来越容易了,有很多现成的框架和开源代码,有什么好想法就尽快付诸行动吧。
挑战我觉得有这么几个,一是推广成本越来越高,独立开发者的精力资力有限,如何能让更多用户知道自己的产品;二是盗版猖獗,反盗版道路艰辛,作为开发者还需要亲身上阵打击盗版维护正版用户(以及自己)的合法权益。
Apple 于 6 月份在中国上海开设了「设计开发加速器」,你对此有所了解吗?
了解过,我觉得表明 Apple 对开发者越来越重视,不过不知道怎么联系……
如果加入其中的话,你希望 Apple 能提供哪些支持?
主要是技术方面和推广方面吧。
最后聊聊你的生活吧,平时获得灵感的方式有哪些呢?
读书、上网、体验别人的产品等都可能会获得灵感。
▲ 图片来自:Unsplash
你和女朋友一起工作时,工作流是如何定的呢?
完全是很天然的决定,她主要做产品设计、UI 设计以及自己的创作,比如绘画,写文章;我主要负责技术实现、产品运营和推广。
起床之后先工作一波,然后早饭(大部分时间自己做),继续工作,午饭(大部分时间自己做),继续工作,锻炼, 晚饭(大部分时间自己做),阅读,睡觉。
偶尔给自己放放假,出去吃别人做的好吃的,她会拍照、收集声音,我负责拿包。
开发工作之余,你最喜欢做什么呢?
看电影,做饭,研究新菜式,旅行放风。
能不能聊聊你最喜欢的一款游戏?
最近很喜欢用「狂野飙车」来放松,以前玩「狂野飙车 8」,现在玩「狂野飙车 9」。
能不能和我们分享一下你的手机首屏,看看你的常用 App?
往期回顾:
独家 | 专访 Coda CEO:离开微软和 Google 之后,他决定挑战 Office
首发 | 批量高效管理 Kindle、微信读书笔记,这款 App 你一定不能错过
专访 | 他环游中国、拍 10 万张照,终于做出这本 App Store 第一的旅游书
专访《简悦》:改善 318 类网站,只为做最好的「阅读模式」
专访《效率控》图拉鼎:一款 App 多用,不止「聚合」这么简单
专访《时间块》安妮:这个喜欢玩 Switch 的女生,要继续用 App 解决生活的「麻烦小事」
专访 Saturday innovation:不到 10 人的独立团队,如何拉上芝麻街做教育?
专访泼辣修图主创:35 人的小团队,如何打造 2000 万人都在用的修图工具?
专访 GoodNotes 主创:如何打造 iOS 上最好的手写笔记?
专访《马卡龙玩图》主创:三千万人都在用,他们如何打造最好玩的抠图 App?
专访 NOMO 开发者飞猪:刷爆朋友圈的相机 App ,从诞生起就是「意外」
专访 WWDC 奖学金获得者翁培钧:从全球作品中突围,他只用了十天
专访腾讯天美工作室:看不见也能玩的游戏,为什么能让玩家泪流满面?
专访徐五四:回顾十年开发经验,这位十项全能的独立开发者说了些什么?