2019-09-01から1ヶ月間の記事一覧

論文メモ_7

Improving performance of end-to-end ASR on numeric sequences数字列を発声した際、システムはそれを文字ではなく数字で表示してほしい。数字へと精度よく変換するための手法の提案。書き起こしに対してtrivialかnon-trivialかをタグ付けし、non-trivialな…

スマホで音声認識

[1] で開発されているプロジェクトのコードを読み、動かす。kaldi、OpenFSTをarmv7でコンパイルし、aarを作成している。コア部分はC++ (kaldi)、front end interfaceはJava。Java側からswigでC++を呼び出している。予めHCLとGをcomposeせず、on-the-fly deco…

Kaldiをwindows上でコンパイルする

Compile Kaldi on Windows参考URL: https://github.com/kaldi-asr/kaldi/blob/master/windows/INSTALL.md 1. OpenFSTのコンパイル以下のプロジェクトをクローンし、slnをvisual studioでビルドする。https://github.com/kkm000/openfst.git 2. Kaldiのコンパ…

論文メモ_6

Synchronous Bidirectional Neural Machine TranslationNMTでforwad pass decoderとbackward pass decoderの情報を統合する試み。ビームサーチレベルでleft-to-rightとright-to-leftの仮説を保持し、pruning後に生き残った両方向の仮説のstateを、それぞれの…

論文メモ_5

AI and Accessibility: A Discussion of Ethical Considerations1. システムの包括性:誰に向けたシステムか。多様なdiversityをカバーできているか。2. バイアス:性別や人種に対する偏見、障害に基づく差別を促さないか。SNSのようなサービスから、知られ…