製造業界のデータサイエンティスト奮闘記

製造業向けのビッグデータ分析やAIによるデータ解析、機械学習についてのブログ

とにかく簡単に、製品不良の原因分析をしてみる(PythonのRandom Forestを使って)

f:id:data_scientist:20181228132620j:plain
不良の原因を突き止めるにあたっては、MT法やT法、新QC七つ道具やらなぜなぜ分析やらいろんなものがありますが、製造業に関して言えば機械学習的なアプローチで進めることはまだ少ないのではないでしょうか。今では機械学習を売りにしたソフトウェアも随分と沢山作られており、「不良の要因分析をしたい」というニーズがあることをどこからか嗅ぎつけて来ては、どこぞの企業が営業をかけてくるという事も少なくないと思います。

とはいえ、設計であれ製造であれ、予算を使ってそれらのソフトウェアを導入すること自体はやぶさかでないにせよ、困っているのは”今”な訳で、何ヶ月もかかるようなPoCをやりたい人はあまりいないと思います。また、担当者がソフトウェアにドンピシャな回答を求めることも稀で、手当たり次第に原因を突き止めようとするのではなく、あくまでアタリをつけるために使いたいという場合が多いように思います。担当者自身はそれなりにノウハウを持っているものなので、ソフトウェアに頼らずともなんだかんだで原因を探り当ててくることがほとんどです。

そんなわけで今回は、予測精度や見つけ出した原因の確からしさといったことは優先順位を落として、とにかく「簡単」に「それっぽい」結果が出てくる方法を紹介したいと思います。使用するのはPythonで、scikit-learnのランダムフォレストというアルゴリズムを用います。流行りではXGBoostやLightGBMといったより高い精度がでやすいライブラリもありますが、今回はインストールも最小になるようランダムフォレストを使っています。また、簡単をモットーに紹介するので、結果の吟味を十分に行わないと、誤った判断をしてしまう可能性がある点については予めご了承ください。

続きを読む

生産計画をPython(PuLP)を使って最適化する

f:id:data_scientist:20181227160421j:plain
生産管理においては、MRP(資材所要量計画)という管理手法は古くからありますが、今でも製造業を中心に当たり前のように活用されています。MRPののちにERPとして製造から受注、出荷、財務、会計など企業内経営資源のほとんどを含むようになり、今では全体最適化の考え方が導入されている企業も多いでしょう。今回は企業内での全体最適というよりも、いち製造担当者が管理できるレベルの生産計画を最適化するための方法について書いてみたいと思います。

Excelでも最適化ソルバーというのもあるんですが、Excelは遅いうえに扱える変数や制約式の数が少ないので、PythonPuLPというライブラリを使った方法について紹介します。

続きを読む

AI(機械学習)で不良品や故障を削減するには

f:id:data_scientist:20180821162151j:plain

 

製造業のミッションは欲しい仕様のモノを安く、欲しい数だけ、欲しい時に顧客に届けるということに尽きます。その目的達成のためにデータサイエンティストも活動するわけなんですが、活動と一括りに言っても、需要予測、特性予測、不良検知、設備保全などデータ活用の適用範囲は多岐に渡ります。今回はそのなかでも、不良を削減するというテーマについて掘り下げてみようかと思います。

続きを読む

製造業界のデータサイエンティストの実際

f:id:data_scientist:20180810134536j:plain

 

さてさて、第一回でどんなことを書こうかなと考えていたわけですが、今回は製造業界のデータサイエンティストという立ち位置で、Kaggleの課題でイメージするようなデータサイエンティストの仕事と製造業でのギャップみたいなものを論じてみようかと思います。

続きを読む

ブログはじめました

はじめまして、TAKと申します。
 
とある製造業の企業(大手部品メーカー)でデータサイエンティストとして働いています。データやAIにまつわるあれこれをやり始めたのはここ3年ほどなので、根っからのデータサイエンティストというより、数ある業務の一つとしてデータ分析をやり始め、徐々に主業務へと軸足をずらしていったという感じでしょうか。
 
大企業とはいえ、メーカーでデータサイエンティストともなると、それなりに希少種ではないかと思います。そんななか孤軍奮闘を続けていると、新しい情報へのアンテナがどうにも錆びついてくるなぁと感じていたので、外部発信をエンジンにスキルアップできないかと思いブログを始めた次第です。
 
エンジニアリング以外では経営コンサルの分野に関心があったこともあって、働きながら大学で経営学を修めた時期もありました。良く言えば幅広い、悪く言えば器用貧乏とも言えますが、理系と文系の両方を学んだからこそ見えてくる視点もあるのではないかと考えています。

このブログでは、データサイエンティストから見た製造業でのデータ活用、というよりも、製造業から見たデータサイエンス的なデータ活用という視点で書いていこうかと思っています。統計分析や機械学習の手法自体は至るところに情報があふれているので、ここでは「メーカーで取り入れるにはどうしていけばいいいか」とか「こういうデータは機械学習よりも品質工学の方がいいんじゃないの?」などの課題や「お上がAI! AI!としか言わない」など政治的な話まで、製造業で現実的に活用していくためのあれこれを経験を交えながら紹介していきたいと考えています。

もちろん、製造業の方だけでなく、製造業向けのAIソリューションを展開したい方やデータサイエンティストを目指す方にも役に立つような内容になればいいなと思います。業界が違えば文化も違うわけで、メーカーの人間からすればAIベンチャーの人間は異国の人のように見えますし、逆もまたしかりでしょう。ゴリゴリのIT畑の人が「メーカーの人ってこんなこと考えてるんだなぁ」と相互理解を深められたら嬉しいかぎりです。

IT業界の方にとっては、品質工学やFMEA、ライン、寸法、QC、4M、などなど、あまり使わない単語が出てくるかもしれませんが、せめてこれくらいは知っててほしい。。。くらいの単語で収めたいと思っていますのでお付き合いいただければと思います。

それではこれから、よろしくお願いします。