ABBYY Cloud OCR SDKは、認識テキストを以下の形式で出力することができます:

形式 処理メソッドのexportFormatパラメータ コメント
TXT txt  
RTF rtf  
DOCX docx  
XLSX xlsx  
PPTX pptx  
PDF pdfSearchable 画像全体がピクチャーとして保存され、認識テキストがその下に入ります。
pdfTextAndImages 認識テキストはテキストとして保存され、ピクチャーは画像として埋め込まれます。
PDF/A-1b pdfa ファイルはPDF/A-1b準拠の形式で保存されます。画像全体がピクチャーとして保存され、認識テキストはその下に入ります。
XML xml

すべての座標がオリジナル画像に基づいて保存されます。 

タグの説明は、XML文書の出力にてご確認ください。 

xmlForCorrectedImage

すべての座標は、ジオメトリー修正後の画像に基づいて保存されます。

タグの説明は、XML文書の出力にてご確認ください。 

ALTO alto  

processImage, processDocumentメソッドを使えば、これらの形式で認識テキストをエクスポートすることができます。また、これらのメソッドで、1つのタスクでエクスポート形式を最大3つまで指定することができます。追加料金は不要です。

さまざまなフィールド処理メソッドは、常に認識結果をXML形式で返します。そこには、認識した文字に関するさらに詳しい情報が含まれます。