iopet.hk我爱宠物I♥PET☻HK

由 **admin** » 周五 11月 07, 2014 2:26 pm

http://bbs.feng.com/read-htm-tid-8557346.html
https://itunes.apple.com/CN/app/id437052502?mt=8
最近一两年开始流行很多“听书”软件，就是将目录库里的小说直接用人声念出来给你听。不过这些听书应用跟《Capti 朗读》相比还是弱爆了。《Capti 朗读》不仅可以听书，基本上网页上的文章、用户保存的 TXT、下载的课本文档（PDF、EPUB、HTML、TXT、DOC、PPT、RTF、ODT等文件格式）等等都可以拿来听，它的好处就是以你想要的速度和声音，把所有的文本材料都变成听力材料。

在美国，《Capti 朗读》是给盲人用的软件，所以你真的不必质疑它的可靠程度。它对普通用户，更大的帮助在于语言学习，比如用 Google Drive 存托福的阅读或者是新概念课文来听，也能上网直接搜文章听，可以循环或者是单独的读其中一篇，因为该应用是储存文本，而不是储存音频，所以不用担心用久了 iPhone 或 iPod 内存不够的问题。将文本加到 Playlist 就完全无需联网了，随时都可以听。

简单说说这个 App 怎么使用吧，启动应用后拉出主菜单列表，Browser 是用来听网页文章的，搜寻到你想听的文章，按住那一篇，加入到 Playlist 上，回到播放界面就可以听了。Clipboard 是可以和其他的 APP 一起用，比如复制粘贴下来某篇文章就可以放进 Playlist。另外上传到 Dropbox 和 Google Drive 的文本也同样可以拉到 Playlist。

Voices 是可以调节速度和选择声音的，有系统预设的发音，也有内购付费的人声，可惜这部分没有免，还是得花钱，不过它的每个声音都可以试用几天，你可以挑选自己最习惯的一项下载，或者直接轮着用，也能听很长时间了。 Setting 里面有个 Synchronization，是连续朗读 Playlist 里的所有文本，相当于听歌的无限循环一样。

之前看官方的回复，说很快就会出中文支持了，现在在 AppStore 的介绍里已经可以看到中文文本和语音的内容了，付费里面也有三个中文语音（预设的电子语音暂时不会讲中文），大家可以去试用看看。

由 **admin** » 周五 11月 07, 2014 3:12 pm

http://www.leiphone.com/news/201411/Ge9 ... tK0Yc.html
“The Voice Donor：为盲胞读书“是由微信市场发起的一个创意公益项目，通过众包模式让众多用户参与进来贡献自己的语音，最后汇聚成一本本的语音读物捐献给盲人同胞。这种新颖的公益方式需要强大的技术来完成，笔者采访了项目的技术支持负责人刘学梁，带你了解为盲胞读书背后的技术故事。
这个项目一开始由微信市场发起。早期，声音捐献数量不大，因而后台能够支撑，而随着越来越多的声音捐献者参与进来，原本的后台及人工审核的机制已经不能够支撑这个参与量级，因而找到北京的技术团队提供支持。“因为他们技术上遇到一些困难，而我们这边正好有语音技术，又是一个公益项目，所以我们都很热心的帮忙，”刘说。从图书切割、下发到语音收集和筛选，最终组装成一本语音读物，都由刘学梁领导的北京团队来完成。
如何筛选和切割一本书？
技术团队的工作之一是把电子书切割成80-120字的片段，存进数据库，并在用户请求时下发给他们。但在此之前还需要经过一个严格的图书筛选过程，选出适合做成有声读物的书籍，取得图书版权后才能进入制作流程。“我们对一本书的质量控制很严格，首先要选取一本合适的读物，还要专门的同事来检验这本书的质量，之间会有很多反馈，质量通关后才会往上放，整个过程比较漫长。”

图书切割也是一个需要技术和技巧的过程。刘学梁说：“我们之前采用全自动化切割，根据标点符号和段落来划分，尽量让每一段长度合理并把说语义关联的字句放在一起，这些都是通过算法来完成的。但采用这种方法遇到一个问题：从出版社得到的书是PDF格式的，PDF转TXT会导致排版上乱掉以及一些页面的缺失，于是我们后来又在自动切割的基础上加了一轮人工切割，对出版社、目录、注释等信息进行处理。切割的长度在80-120个字之间，切完片段会存到数据库，有用户请求时从数据库下发。如果下发了用户没读就会发给另一个人读。”
如何进行语音筛选？
语音筛选是团队遇到的最大技术难题，这里面需要用到语音技术，把好的语音和不好的语音区分开来，比如说有人念的不好或是不完整，噪音太多需要过滤等等。语音筛选是一个与文本对比的过程。
“通常一个语音过来，先经过特征提取，再经过解码器，取一个最好的结果出来，这是一个类似语音识别过程。但是筛选是先有了语音和对应的文本，再要计算语音和文本之间匹配关系，这需要先用文本构建出一个搜索网络，然后在搜索网络里面计算出一个得分，再根据这个得分判断这段语音好还是不好，有没漏读或错读。如果读的比较平滑准确就是一段好语音，它会被筛选出来作为语音读物的材料。这与普通话等级考试有些类似，同样都要匹配文本，看你读的是否准确平滑。”

语音筛选有一个打分的过程，通过这个过程对语音的质量进行评估，实际结果显示，女性的语音质量通常要比男性高，“她们更加自信，读得也更加认真”。而项目的大部分（估计有90%左右）参与者都是女性，结果是一本书大部分都是女性的声音。
总体上后台好的语音还是占大多数，差的语音也存在。哪些因素会导致语音质量不高？主要有三点：
手机质量不好，采集的语音质量就会较差，这部分会放弃掉；

之前有一个bug导致录入语音时文本被遮挡，这样读出来的语音不完整；

很重的口音，或者有些人离话筒比较远，也会导致语音质量不高。

刘学梁说他们非常珍惜每一段语音，尽量不浪费。一个片段只会投放给一个人，只有当这个人没有读或是读的质量真的有问题，比如有缺损，才会筛除并让发给下一个读。
众包制作的有声书，质量能比得上专业的吗？

简单的回答是：不能，但已经接近了。但是，众包读书还有自己的优势和公益的性质。众包的有声书由成百上千人的语音构成，而且这些人都不是专业朗读者，如何提高质量呢？
“如果是专业朗读者去读这些书的话，质量自然会更高一些，但是为盲胞读书采用众包模式的优势是速度会快很多，一个人一天读不了一本书，但几万人一起读的话一天就能读好几本，长期下来就能积累很多书。对于每个人声音不同这方面，习惯了之后其实还好，把不同人的声音连接时我们也会做一些处理，使它们音量一样，让前后两个人的声音区分度不会太大，同时把语音的前后空白处剪切掉，听起来会更流畅。另外我们在进行文章切分时会尽量让一段话保持完整，由一个人来读，这样语音之间断层也是段落之间的区分。而且很多人会连续读好几段，我们也会优先考虑把同一个人读的段落放在一起。”
实际上，为盲胞读书的用户质量非常高。比如有一些片段包含德文、法文等小语种，多数人都不懂，会读得很差，但也有很多用户能把它流畅读出来。笔者在公众号后台亲身体验后发现，很多语音都读得非常专业。
结语
一本书总会有一些段落直到最后还是没有读完，这个时候团队成员会自己上马把它们读完，尽快集结成一本有声书。
不同的书读的速度也不一样，快的一两天就能读完（团队会同时下发好几本书），一般是名人领读较受欢迎。
似乎过程很麻烦，质量也未必比得上专业朗读者制作的，但这种方法制作出来的有声书已经不仅仅是一个商品，它包含了成千上万人的爱心在里面。为盲胞读书（公众号：voicedonate）已经拥有超过50万参与者，截止目前已制作出超过100本有声书，有越来越多的盲人同胞从中受益，希望你也能参与进来。

iopet.hk我爱宠物I♥PET☻HK

限時免費听书APP Capti Narrator

限時免費听书APP Capti Narrator

Re: 限免听书APP Capti Narrator

在线用户

iopet.hk我爱宠物I♥PET☻HK

限時免費 听书APP Capti Narrator

限時免費 听书APP Capti Narrator

Re: 限免听书APP Capti Narrator

在线用户

限時免費听书APP Capti Narrator

限時免費听书APP Capti Narrator