Japanese / English

Detail of Publication

Text Language Japanese
Authors Kazutaka Takeda, Koichi Kise, Masakazu Iwamura
Title 1億ページのデータベースを対象とした大規模文書画像検索
Journal 電子情報通信学会技術研究報告
Vol. 112
No. 441
Presentation number PRMU2012-161
Pages pp.131-136
Location 大阪府堺市
Reviewed or not Not reviewed
Presentation type Oral
Month & Year February 2013
Abstract 本稿では,1億ページのデータベースを対象とした大規模実時間文書画像検索法を提案する.我々はすでに,1,000万ページのデータベースから実時間で検索可能な手法を提案している.この手法を用いてさらなる大規模化を実現するためには,より一層のメモリ削減が求められる.同時に,メモリ削減による検索精度の低下を抑制する必要がある.これを実現するため,検索に有効な特徴量のサンプリング法と,特徴量の柔軟な照合を実現するための多重探索法を提案する.1,000万ページのデータベースを用いた実験から,従来手法と比較して,検索精度を維持したまま70%のメモリ削減を実現できることが分かった.また,1億ページのデータベースから,必要メモリ量236GB,精度98.7%,処理時間26.8msで検索でき,高いスケーラビリティを持つこと確認した.
Back to list