新年あけましておめでとうございます。昨年8月を最後にブログの投稿が止まっていて久しぶりの投稿ですが、今年も時間をみつけて記事を残していきたいと思います。
新年1発目はAzure Cognitive Serviceの話になりました。
それではまいります。
Contents
Cognitive Service Containerとは
Cognitive ServiceのAPI群をオンプレミス環境内で使えてしまう機能になります。詳細は以下へ。
Azure Cognitive Services コンテナーをオンプレミスで使用する – Azure Cognitive Services | Microsoft Learn
実際に使ってみた
さて、今回はCognitive Service Containerの中でもOCRコンテナを試してみたいと思います。
ここからの手順は以下のチュートリアルに沿っています。最新の手順は以下Docsを確認ください。
Computer Vision 3.2 GA 読み取り OCR コンテナー – Azure Cognitive Services | Microsoft Learn
前提として、手元環境でDockerが利用可能な状態とします。
Azure Cognitive Service – Computer Visionリソースの作成
フォームの申請
Docsによると、現在は以下フォームから申請することで利用できるようになるようです。承認は開発チームにより行われ、10営業日以内に利用可能になるようです。
Computer Vision 3.2 GA 読み取り OCR コンテナー – Azure Cognitive Services | Microsoft Learn
Dockerイメージのダウンロード
Azure Cognitive Services Computer Vision Read OCR by Microsoft | Docker Hub
docker pull mcr.microsoft.com/azure-cognitive-services/vision/read
コンテナの実行
Computer Vision 3.2 GA 読み取り OCR コンテナー – Azure Cognitive Services | Microsoft Learn
docker run --rm -it -p 5000:5000 --memory 16g --cpus 8 \
mcr.microsoft.com/azure-cognitive-services/vision/read:3.2-model-2022-04-30 \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}
コンテナが実行されていることの検証
Computer Vision 3.2 GA 読み取り OCR コンテナー – Azure Cognitive Services | Microsoft Learn
実行開始後、localhost:5000にアクセスすると・・・コンテナが実行されていることが分かります。
localhost:5000/statusにアクセスすると、APIキーが有効かどうかが分かります。
localhost:5000/readyでは、コンテナがクエリを受け取る準備ができているかが分かります。
localhost:5000/swaggerでは、コードを記述することなくAPIを試すことができるようになっています。これは便利ですね。
APIの実行
試しにこのSwagger MenuからAnalyze APIを実行してみる。Web上で利用可能になっていたサンプル請求書pdfのURLを記載してAPIを実行してみると・・
レスポンスコード202とともに、operation-locationタグ内に結果のURLが含まれて返ってきました。
このURLにアクセスすると・・OCRで読み取られた結果が返ってきていることが確認できました!
以上、Cognitive Service ContainerのOCRコンテナを利用してみた、の記事でした。
少しでも参考になりましたら幸いです。
おしまい
コメントを残す