BLOG

【AI開発チャレンジ】顔認識機能つくってみよう!【Python】-#1環境構築編-

2024-04-23

どうもロックシステムのみなみです!
今回からYoutube新シリーズ『【AI開発チャレンジ】顔認識機能つくってみよう!』がスタートしました!

テーマはAI!AI開発の中でも比較的簡単に作れる顔認識機能づくりにチャレンジしていきます!
顔認識はスマホの顔認証や建物のセキュリティなどの身の回りでも使われていますよね。今回はPythonとChatGPTを使って、AI開発が初めての方でも挑戦しやすい内容でお送りします!

第一回は環境構築編です!
開発をしていく上で必要なソフトやツールをダウンロードしていきましょう!

ダウンロードしていくもの

■Visual Studio 2022 コミュニティ
https://visualstudio.microsoft.com/ja/downloads/
Visual Studio は、開発サイクル全体を 1 つの場所で完了させるためのツールで、C#でのWEBシステム開発やWindowsアプリの開発などに使われることが多いです。
今回は使いませんが、この後紹介するdlibをインストールする時にエラーを出さないためにインストールしておきます。

■Python3.10.7
https://www.python.org/downloads/release/python-3107/
AI学習やデータ分析などの先端技術開発でも広く活用されている人気の言語です。シンプルで読みやすく、AI開発に必要なライブラリやフレームワーク、AI学習用のデータセットも充実しています。

■dlib 19.24.1
機械学習・データ解析アプリケーションを作成するためのツールキットです。今回は顔検出器として使っていきます。

■opencv-python 4.7.0.72
無料で配布されている画像処理・画像解析のためのライブラリです。顔検出のための画像読み込みや顔領域の描画などに使います。

■numpy 1.24.3
数値計算を効率的に行うためのPythonの拡張モジュールです。顔領域の座標を扱うために使います。

『dlib 19.24.1』『opencv-python 4.7.0.72』『numpy 1.24.3』はPowerShellのpipコマンドを使ってインストールしていきます。

pip install dlib==19.24.1 opencv-python==4.7.0.72 numpy==1.24.3
おなじくPowerShellでpip listコマンドを使ってインストール確認も可能です◎

pip list

■学習済みの重みファイル(res10_300x300_ssd_iter_140000_fp16.caffemodel)
配布元URL:https://github.com/spmallick/learnopencv/blob/master/FaceDetectionComparison/models/res10_300x300_ssd_iter_140000_fp16.caffemodel

■ニューラルネットワークモデルの設定ファイル(deploy.prototxt)
配布元URL:https://github.com/opencv/opencv/blob/master/samples/dnn/face_detector/deploy.prototxt

ちなみに、、

ニューラルネットワークとは…
コンピューターがデータを学ぶ方法の一つ。人間の脳の仕組みを真似ていて、ニューロンと呼ばれる計算ユニットの繋がりや、脳と同じ層状構造で情報の処理をしています。
画像認識に広く活用されていて、画像の分類、物体の検出、顔認識などで主に使用されています。
今回作っていく顔認識以外では、自動車の自動運転技術でも使われています。ニューラルネットワークを用いて道路の標識、信号、他の車両、歩行者などを識別し、周囲の環境を理解し、安全に運転を行うことができるのです。


以上で環境構築は完了。次回からは実際に顔認識機能をつくっていきます!

株式会社ロックシステム

「ブラック企業をやっつけろ!!」を企業理念にエンジニアが働きやすい環境をつきつめる大阪のシステム開発会社。2014年会社設立以来、残業時間ほぼゼロを達成し、高い従業員還元率でエンジニアファーストな会社としてIT業界に蔓延るブラックなイメージをホワイトに変えられる起爆剤となるべく日々活動中!絶賛エンジニア募集中。