top-10-pitfalls-in-developing-machine-vision-systems-with-artificial-intelligence
top-10-pitfalls-in-developing-machine-vision-systems-with-artificial-intelligence

人工知能を用いたマシン ビジョン システム開発の落とし穴Top10

Graphic of a digital eye with Avnet 100 year anniversary logo at the bottom right corner

マシン ビジョン(MV)と人工知能(AI)により、幅広い先端技術のアプリケーションで、価値の高い検査機能や解析機能が実現します。しかし、あらゆる高度な技術には、回避すべき落とし穴があります。

マシン ビジョンは、一つ以上の電子カメラ、高度な光センサー、アナログデジタル コンバータ(ADC)、デジタル シグナル プロセッサ(DSP)を使用して、周囲やオブジェクトを確認する電子システムの機能を指します。この技術の原始的な形態は、数十年にわたり、医薬、防衛/航空宇宙、産業オートメーション分野のさまざまなアプリケーションに用いられてきました。

近年の3Dセンシング技術の改良、コンポーネント モジュールの小型化、高品質CMOSイメージセンサーやパワフルなデータ プロセッサの大幅な価格値下げに伴い、マシン ビジョンのアプリケーションが、今や、指数関数的成長を遂げています。Grand View Researchは、この爆発的な成長が続き、世界的なマシン ビジョン市場は、2025年までに182.5億米ドル規模に達し、CAGRは7.7%になると予測しています。

マシン ビジョン システムの新たな市場に含まれるもの:

  • ファクトリー オートメーションとロボット工学:外観検査、診断、組み立て、移動式ロボット、デジタル ファブリケーション、サービス ロボット、レスキュー ロボット
  • 高度道路交通システム:交通監視、自律走行車、運転者安全支援
  • セキュリティと法執行:セキュリティ監視、カメラ ネットワーク、リモート センシング、水中環境および悪環境
  • ライフ サイエンス:農業、林業、漁業、土木建築、商業、スポーツ、ファッション、住居など
  • マルチメディア:データベース、保管/検索、ドキュメント、文化/遺産、仮想現実(VR)/複合現実(MR)/拡張現実(AR)、エンターテイメント
  • 生物医学:トモグラフィー、内視鏡検査、コンピューター支援診断、コンピューター支援手術、計算解剖学、バイオインフォマティクス、看護ケア
  • ヒューマン・コンピュータ インタラクション:顔/ジェスチャ/行動/歩行/視線解析、バイオメトリクス、ウェアラブル コンピューティング、一人称視点システム

 

近年のGartnerの調査によると、2025年までに:

  • 自動車産業でのマシン ビジョンを統合した先進運転支援システム(ADAS)の普及率は、現在の10%レベルから、35%へと上昇する。
  • 小売店舗でのマシン ビジョン技術のアプリケーションにより、客足を20%増加させ、ターゲットを絞った取り組みにより、店舗の利益率が10%成長する。
  • 家電製品メーカー上位5社が販売するスマート家電全体の20%で、マシン ビジョン技術が使用できるようになる。
  • ほぼすべてのプレミアム スマートフォンと、基本的なユーティリティ スマートフォンの30%にマシン ビジョン機能が搭載され、顔やジェスチャ認識機能が、標準の認証機構として有効となる。

 

マシン ビジョンの歴史は、RCAで働いていたP. K. Weimer、S. V. Forgue、R. R. Goodrichのチームが早期の電子カメラに使用された撮像管を開発した、1950年代まで遡ります。撮像管は、画像をキャプチャするターゲット材料として光伝導体を使用していました。NASAは、1970年代後半まで、リモート センシング機能を搭載した無人遠距離宇宙探測機の大半にRCA撮像管 カメラを採用していました。

マシン ビジョン ソリューション開発と実装を成功に導くカギとなるのは、信頼できる技術パートナーと協働し、ビジョン アルゴリズム、カメラのインターフェイス標準、高度な分析、人工知能、機械学習を提供する、ハードウェアの構成要素とソフトウェアの必要なフレームワークを構築することです。すべての企業に当てはまることですが、物事を進めるには、正しい方法と誤った方法があります。現代のマシン ビジョン ソリューションを開発するにあたって、検討すべき上位10項目をリストにまとめました。

1. 質の高いデータから開始し、次にAIを開発する:正しく運用するには、マシン ビジョン システムが画像を取得し、処理し、分析し、理解する必要があり、これをAIで実装します。この理解には、トレーニング データと呼ばれる情報をまとめ、AIを学習させることで達成します。トレーニング データの質が高ければ高いほど、AIの品質は向上します。これにより、マシン ビジョン システムのパフォーマンスが向上します。質の低いトレーニング データや、限られた量のトレーニング データでは、AIの機能やマシン ビジョン アプリケーションの成功を阻むことになります。 高度にプログラムされたAIであっても、ふさわしいトレーニング データがなければ、適切な結果を出すことはできません。

2. スコープ クリープに注意する:プロジェクトの現実的な予測を立て、達成可能な目標を据えて開始しなければなりません。人間の脳は、五感から得るデータを同時に処理でき、瞬時にそのデータに反応して行動することができ、マルチタスクに対応します。マシンは、一つのタスクに非常に優れた働きができるようプログラムされていますが、AIに複数のタスクを学習し、実行するよう求めると、うまく処理できないことがあります。初期の計画段階で、成功につながるであろう主要な機能に重点に置く必要があります。AIアプリケーションの初期のビルドに広範囲の異なるタスクを遂行させようとすると、適切に実行できず、満足のいく結果を出せない場合があります。

3. ビジョンの言語:マシン ビジョン アプリケーションを成功に導くには、有用なハードウェアだけではなく、巧みなプログラミングも求められます。プログラミングは、AIフレームワークやコーディング言語の形態を取る場合があります。人工知能のフレームワークにより、機械学習、ディープ ラーニング、ニューラル ネットワーク、自然言語処理など、AIアプリケーションをすばやく、かつ容易に開発できます。AIフレームワークは、人工知能システム開発のテンプレートとしての役割を果たします。これにより、一からAIアプリケーションを開発することと比較すると、開発、デプロイ、ガバナンスがはるかに容易になります。AIと連携するプログラミング言語にはさまざまあり、それぞれに強みがあります。これらの言語には、Caffe、Python、Pytorch、TensorFlow、C++、Lisp、Java、R、Prolog、Model Zooが含まれます。

ビジョン アプリケーションの計画段階で、社内または契約業者のプログラミング リソースを用いるのかどうかを定めることが重要です。プログラマーのスキル レベルはどの程度か?どのプログラミング言語を用いるのか?選択したプログラミング言語に最適な開発ツールは何か?AIプログラムやその後のアップデートを簡単にコンパイルできるか?アップデートをどのように配信するのか?

4. 適切なハードウェア ブレーンを選択する:マシン ビジョンAIアプリケーションを実行するハードウェアを決めるにあたって、さまざまなオプションがあります。フィールド プログラマブル ゲート アレイ(FPGA)、画像処理装置(GPU)、マイクロコントローラ(MCU)には、それぞれの利点があります。

FPGA:FPGAは、ほとんどすべてのアプリケーションの要件を満たすよう構成できる、非常にパワフルな処理装置です。特定のアプリケーションを処理するために、カスタマイズされたFPGAアーキテクチャを作成することができます。これにより、GPUやCPUと比較して、より高度なパフォーマンスを、低コストかつ優れた電力効率で、達成することができます。

GPU:GPUは、主に画像やビデオを処理するためにデザインされた特殊なプロセッサです。CPUと比較して、GPUは単純な処理装置に基づいていますが、はるかに大量のコアをホストします。そのため、GPUは、画素やビデオ コーデックのような、並行して大量のデータを処理しなければならないようなアプリケーションに優れています。GPUの限界を挙げるとすると、エネルギーを大量に消費し、CUDAやOpenCLのような言語でプログラムされているため、CPUと比較すると柔軟性に劣ります。

CPU:CPUはコア数が限られているため、AIに必要な膨大なデータをすばやく処理する能力に制限があります。そのため、CPUは効率的な小さなバッチサイズの小型モデルにのみ適しています。CPUの利点は、プログラミングが容易であり、コスト面や、プログラミング フレームワーク向けのサポートが充実していることが挙げられます。

ハードウェアを選択する際に検討すべき他の要素には、エネルギー効率、デバイス モビリティ、IO数、動作環境、そして最も重要な点として、コストが含まれます。計画の初期段階で、徹底的かつ積極的に吟味することで、以降の段階で生じる悩みの種を減らすことができます。すべてのプロセッサとサポートする構成要素を用いて、将来的に利用可能な機能に対応できる処理能力と、ファームウェアのアップグレードやAIアルゴリズムの拡張を処理するため、十分なオンボード メモリを備えてください。

5. イメージセンサーと照明:CMOSセンサー技術の表面照射(FSI)と裏面照射(BSI)の進歩により、暗い中でも、高解像度画像が取得できるようになります。適切な照明も重要な検討事項です。照明性能の基本は、3つの主要なイメージセンサーの特徴に分けることができます。量子効率(QE)、暗電流、飽和容量です。量子効率は、特定数の入射光子に対して、デバイスが生成する電荷比として計算します。QEはさまざまな波長で変化するため、波長の関数として示されます。これを用いて、デバイスの感度を正確に測定することができます。カメラ内部に実装すると、外部の光学的効果と電子効果により、カメラの最大QEは、センサーの最大QE未満になります。

暗電流と飽和容量もマシン ビジョン システムの重要なデザイン面での検討事項です。暗電流は、CMOSイメージャー内部で熱的に生成される電子の数の変動を測定し、ノイズを発生させることができます。飽和容量は、個々のピクセルが保存できる電子の数を示します。これらのパラメーターは、一般的にカメラ メーカーのデータ シートには明記されていませんが、QE測定と使用して、アプリケーションの最大SN比(S/N)、絶対感度、ダイナミック レンジを導き出すことができます。

適切な照明は、マシン ビジョン アプリケーションの精度や効率を高めるのに役立ちます。照明と共に検討すべき他の要素には、赤外線、固定照明、照明の配置など、波長が含まれます。マシン ビジョン システムのカメラに直接当たる光源や反射は、オブジェクトの検出精度を低下させることが示されています。

6. 背景の識別:背景は、マシン ビジョン システムで特有の問題を生じさせる場合があります。セキュリティ システムが、悪役が身に着ける黒い衣装から、黒い銃を識別できない場合を想像してください。工場内にある反射する金属製のオブジェクトにより、ビジョン検出アルゴリズムが適切に機能できない場合、同様の問題が生じる場合があります。セカンダリ アルゴリズムが、赤外線やアダプティブ ライティングのような、異なる波長の電磁(EM)スペクトルを強調することで、この問題を解決できる場合があります。 

7. オブジェクトの配置と方向:AIを用いて、マシン ビジョン ソリューションがトレーニング データから学習したオブジェクトを認識できるようにします。同じオブジェクトを取り出し、方向を変えると、マシン ビジョン システムの中には正確に認識できないものがあります。この問題は、AIの正確なトレーニングを通じて解決できますが、膨大なデータが必要になります。

8. オブジェクトのスケーリング:2フィート先と10フィート先からバスケットボールを見て、私たちは、それが同じオブジェクトであり、オブジェクトまでの距離が異なることを理解できます。これは、AIのさまざまなトレーニングと正確な試験により、オブジェクトを正確に識別できる距離を確保するのに役立つ場合があります。また、レンズや焦点距離の選択も、アプリケーションのパフォーマンスに直接影響を及ぼします。大抵のマシン ビジョン システムはピクセル値を読み取りますが、可動アプリケーションのデプロイを成功させるには、スケーリングの観点から検討することが重要です。

9. オブジェクトの歪み:マシン ビジョン システムがわずかに歪みのある同じオブジェクトを認識する機能は、特に輸送やセキュリティ分野のマシン ビジョン アプリケーションでは非常に大切です。アプリケーションの精度や運用の安全面という観点では、関節肢を持つ歩行者を識別できる必要があります。ここでもまた、AIが学習する、質の高いトレーニングの実施が重視されますが、膨大なデータを必要とします。

10. アクションと移動:すばやい移動は、マシン ビジョン システムに問題が生じる可能性があります。これは、安全性が非常に重視されるアプリケーションでは弊害となる場合があります。イマージャーの正しいシャッター選択、特殊なプログラミング アルゴリズム、照明によって、この問題を解決できるかもしれません。安価なイメージセンサーは、ローリング シャッターを利用することが多く、動きの早い画像が破損する可能性があります。グローバル シャッターはイメージセンサーのコストがかさむ原因となるものの、すばやい動きを正しくキャプチャするには必要な機能です。予測し、備えを行うことは、人間の知能を見極めるために使用される2つの要素です。同じことがAIアプリケーションにも当てはまります。

重要ポイント

マシン ビジョン技術の強力なイノベーションと導入の拡大により、市場価値は直近5年間で、およそ100億米ドルの増加を後押ししました。この大幅な成長に伴って、AIアルゴリズム、処理コンポーネント、光源、イメージセンサー、その他関連する技術が急速に発展を遂げています。市場にあるさまざまな多数の選択肢がある中で、時代を先取りし、競争に勝つことは簡単ではありません。

次のイノベーションに向け、正しい技術パートナーを選択することで、効率性を最適化し、潜在的なリスクを軽減し、収益を最大化することができます。お客様の目標を達成するため、アヴネットは、マシン ビジョン システムの信頼できる世界的技術パートナーをお客様と結び付けることができます。これにより、知的財産のイノベーションや、強力な優位性を秘める他の分野に、お客様の貴重なリソースを集中的に使用することができます。当社は、一体となって、お客様の製品販売の差別化を成功に導き、市場投入までの時間を加速し、ビジネス成果を改善するのに必要なサポートを提供いたします。

重要ポイント

アヴネットは、100年にわたるイノベーションを礎として、あらゆる段階において、お客様が新たな技術を開発したり、提供したりする際に直面する課題を切り抜けられるよう、サポートを行っています。当社は、お客様のイノベーションを支え、課題をチャンスに変え、成功へと繋がる正しいソリューションを構築するための専門的知識を有しています。信頼できる世界的技術パートナーとして、アヴネットと共にお客様の展望を実現させ、さらなる高みへと前進してください。

top-10-pitfalls-in-developing-machine-vision-systems-with-artificial-intelligence
top-10-pitfalls-in-developing-machine-vision-systems-with-artificial-intelligence
関連記事
Integration of Multiple Technologies Heralds a New Era in Smart Healthcare
eVTOLが牽引する『低高度経済』の急成長
2025年3月17日
将来のeVTOL機器は、主に都市間の迅速な通勤、効率的で柔軟な物流配送、公共サービスへの緊急対応などの分野に使用されます。
Integration of Multiple Technologies Heralds a New Era in Smart Healthcare
アヴネット、産業オートメーションとスマートな未来を実現する多機能ロボットを推進
2025年2月15日
歩みを止めない技術進歩を見据え、多機能ロボットが将来の産業や日常生活でますます重要な役割を果たすようになるでしょう。
top-10-pitfalls-in-developing-machine-vision-systems-with-artificial-intelligence
関連イベント
関連イベントはありません