多元ビッグデータ解析に基づく
知の創出プロジェクト
プロジェクト統括
情報科学研究科
教授 中村 哲
どのぐらいの大きさか
情報通信審議会 新事業創出戦略委員会・研究開発戦略委員会 ICT基本戦略ボード(第7回)会議資料2015/3/20 Satoshi NAKAMURA@AHC,NAIST 2
情報通信審議会 新事業創出戦略委員会・研究開発戦...
H23
文科省情報爆発(H18-H22)
(各種Webデータの分析に関する諸研究)
経産省 情報大航海(H18-H22)
(ネットのマルチメディア情報処理の諸研究)
米国 DARPA TIEDSプロジェクト,
GALEプロジェクト(H18-H2...
なぜ今か?②&③
物質科学:
• 機能性材料の開発は、素材となる物質の発
見に加え、それら基本物質を基にした改良に
よって実現。
今後,高次の機能性材料の開発を進めるに
あたり、多様化した機能性材料を、分野横断
的に融合することが必要。
この流...
社会的課題:人材の不足
5情報通信審議会 新事業創出戦略委員会・研究開発戦略委員会 ICT基本戦略ボード(第7回)会議資料2015/3/20
政策との関連
• 第4期科学技術基本計画:
「我が国の産業競争力の
強化」、「研究情報基盤の
整備」
• 平成24年10月総合科学
技術会議 『ビッグデータ
による新産業・イノベーショ
ンの創出に向けた基盤整
備』を選定
①多元ビッグデータ解析...
/28
ビッグデータ解析による新たな知の創出
知見
知見
高速,広帯域ネットワーク
ビッグデータ
データデータ
統計
解析
研究
• 統計解析技術の高度化に力点
• 具体的研究対象と解析研究が乖離
• 成長的なループが脆弱
知見
知見
高速,広...
センサー
データ
Blogs,
E-mail
Web
Data
Docs,
PDFs
Images/
Videos
高速ネットワーク
データ、アクセス
クローリング、フィルタ
リング
データセンタ
NoSQL, Hbase,
Hive
大規模分...
成長的ループにより産学連携
多元ビッグデータ
解析と新たな知の
創出の研究と教育
実世界
データ蓄積
実利用者
実アプリケーション
サービス公開
データベース公開
性能向上
新サービス公開
• 利用者の実使用詳細ログ
• 利用者の評判,リクエス...
多元ビッグデータ解析に基づく知の創出研究拠点事業 体制図
自然言語処理、意味解析、
評判分析、情報分析
松本研究室
テキスト、音声、
大規模パターン認識、
多言語翻訳
中村研究室
機械学習
池田研究室
データベース
加藤研究室
大規模画像処理
...
H26 H27 H28 H29 H30 H31
研究計画
研究設備
導入計画
詳細化
体制構築
データ収集システム構築
データ収集開始
初期検討 研究の高度化
解析システム構築
初期評価、改良
初期評価 高度化
• 全体システム統合と評価、実証...
応用事例①(バイオ)
E-Scienceに関する 深い質問応答 の実例
(遺伝子情報のマイニング)
環境・状況
個人情報に応じた
知識の獲得
(位置情報、
環境映像、
環境音、音声、
個人情報)
学習情報
文献情報からの知
識獲得データベー
ス...
応用事例②(医療情報の提供)
医療情報に関する 深い質問応答 の実例
環境・状況
個人情報に応じた
知識の獲得
(位置情報、
環境映像、
環境音、音声、
個人情報)
Web一般情報
多言語のニュース
Twitter
Blog
Wikipedia...
応用事例③(災害への対応方法)
原子力発電所からの放射線の影響に関する生活安全情報(ニュース、放射
線計測情報、個人環境、Twitter などを)対象にした深い質問応答 の実例
環境・状況
個人情報に応じた
知識の獲得
(位置情報、
環境映像、...
/28
研究の新規性
新たな知の創出により、
これまでのWhat, Who, When, Where に加えて,ゼタバイトに拡張するインター
ネット上の世界中のブログ,ソーシャルメディア,センシングデータ等の情報か
らHow, Why 型の知識...
産業分野への貢献
金融分野
– マーケティング分野
• 住宅ローン申し込み顧客推定、生命保険顧客推定、銀行商品の組合せ、ダイレクト
メール発送先選定
– 業務特化分野
• 自動車保険設計、社債格付予想、クレジットカード不正使用パターンの抽出
流...
最後に
データ中心科学
– 新たな科学を生み出せるか
ビッグデータアナリティクス
– クラウド型の登場で大規模データの収集が可能
– だが、どう分析して良いか分からない
これまでと何が違うのか
– 大規模データの集積、計算が可能に(NoSQL,...
of 17

NAISTビッグデータシンポジウム - 情報 中村先生

NAISTビッグデータシンポジウム - 情報 中村先生
Published on: Mar 3, 2016
Published in: Technology      
Source: www.slideshare.net


Transcripts - NAISTビッグデータシンポジウム - 情報 中村先生

  • 1. 多元ビッグデータ解析に基づく 知の創出プロジェクト プロジェクト統括 情報科学研究科 教授 中村 哲
  • 2. どのぐらいの大きさか 情報通信審議会 新事業創出戦略委員会・研究開発戦略委員会 ICT基本戦略ボード(第7回)会議資料2015/3/20 Satoshi NAKAMURA@AHC,NAIST 2 情報通信審議会 新事業創出戦略委員会・研究開発戦略委員会 ICT基本戦略ボード(第7回)会議資料 (1021bytes)
  • 3. H23 文科省情報爆発(H18-H22) (各種Webデータの分析に関する諸研究) 経産省 情報大航海(H18-H22) (ネットのマルチメディア情報処理の諸研究) 米国 DARPA TIEDSプロジェクト, GALEプロジェクト(H18-H22) (国防のための多言語情報翻訳 分析、蒸留) Google 検索 NAIST アンビエント 事業(H21-H25) H24 H25 H26 H27 H28 NAIST多元ビッグデータ解析 に基づく知の創出研究拠点 事業(H26-H31) H29 なぜ今か? ① 情報科学: H31H30H22H21H20 医療費 社会保障費予 算の危機 震災、津波災害 情報のマネージ メント危機 サイバーテロ、 プライバシー 問題 国際ビジネス、 国際安全情報 の不足 国際マーケティ ング、新規ビジ ネス不足 科学データ分析、 国際研究競争 力の強化 大学の国際競争力、 産学展開力不足 学生の国際競争力、 リーダシップ力不足 データの加速度的膨張に伴い 多くの課題が発生 3
  • 4. なぜ今か?②&③ 物質科学: • 機能性材料の開発は、素材となる物質の発 見に加え、それら基本物質を基にした改良に よって実現。 今後,高次の機能性材料の開発を進めるに あたり、多様化した機能性材料を、分野横断 的に融合することが必要。 この流れに歩調を合わせるように、材料分 野・化学分野毎に情報共有可能なデータ ベースが構築され、データベースを基にした 新規化学合成法の開発や物性評価などが盛 んに。 • しかしながら、現在もなお、これらのデータ ベースはそれぞれ孤立した状態にあり、分野 横断的な利用は必ずしも実現されていない。 • 構築されつつある個々のデーターベースを 融合し、シームレスな利用を実現することに よって、新規材料開発・評価の効率化をはか り、社会のニーズにいち早く応えることが喫緊 の課題。 バイオサイエンス: • 20世紀後半の分子生物学は、生物の持つ部品 の情報を分子レベルで明らかに。 • それらの部品がどのようなルールで生物という システムを構築しているかは手つかず。 • 21世紀になろうとする直前に立ち上がって来た ゲノム研究、オミックス研究、システム生物学は、 それまでの分子生物学ではなし得ない生命に おける遺伝子、遺伝子産物、代謝産物等の部 品がどのようなルールで細胞を構築し、生命を 成り立たせているのかに迫る新たな学問。 • 膨大な細胞のスナップショット(ビッグデータ)か ら、その動きのルールを探る研究は喫緊の課題。 4
  • 5. 社会的課題:人材の不足 5情報通信審議会 新事業創出戦略委員会・研究開発戦略委員会 ICT基本戦略ボード(第7回)会議資料2015/3/20
  • 6. 政策との関連 • 第4期科学技術基本計画: 「我が国の産業競争力の 強化」、「研究情報基盤の 整備」 • 平成24年10月総合科学 技術会議 『ビッグデータ による新産業・イノベーショ ンの創出に向けた基盤整 備』を選定 ①多元ビッグデータ解析に基づく知の創出研究 全研究科を横串に取纏めを行う拠点リーダ(PI)、研究・教育アドミニストレータ、産学アドミニストレータを配置 ②ビッグデータアナリティックス教育の充実 新たに、研究科横断、産業界との連携教育プログラムを設置 (2013年度から「ビッグデータアナリティックス」を産業界と共同で情報科学研究科で開始) 多元ビッグデータ解析技 術・人材育成 • 国際情報収集力 • 情報分析力 • 迅速な研究展開力、変革 力 実社会とリンクした研究教育! 情報科学研究科 処理技術 • 情報収集 • 分析、統合 • 多言語翻訳 • 可視化 • セキュリティ • 計算基盤 • ネットワーク 生活社会情報 データ 物質情報 データ 物質創成科学研究科 産業界協働 • (課題創出型 共同研究など) 実利用者、産 業界、サービ スプロバイダ 新 た な 知 の 創 出 技 術 ビッグデータ 解析技術、技術 者、研究者 ビッグデータ 関連新ビジネス ビ ッ グ デ ー タ 解 析 研 究 ・教 育 実 験 サ ー ビ ス 技術移転 講義演習 共同研究 成果 サービス 実データ バイオ情報 データ バイオサイエンス研究科 人材 新たな知の創出技術の新 展開 • How型,Why型知識自動 抽出 • 因果関係抽出 • 知識構造抽出 • 予測,推論,質問応答 社 会 と リ ン ク し て 研 究 、 技 術 を 持 続 的 に 成 長 さ せ る ル ー プ 研究アドミニストレータ 産学アドミニストレータ 教育アドミニストレータ 社 会 実 装 拠 点 リ ー ダ ー (知 の 融 合 ) 実 施 体 制 3研究科のデータ(ビッグデータ)を拠点リーダ(PI)を通じて統合的に研究、新たな知を創造し、それを大学内のみならず、産業界をはじ めとする社会に還元し、社会とリンクして研究、技術を持続的に成長させるループを構築し、実社会とリンクした研究教育体制を築く。 大学の変革 • 全学で共通の課題に取り 組むダイナミックな体制構 築 本事業は研究は当然の ことながら、大学や社会 の機能強化にも貢献 こ の 体 制 で 取 り 組 ん だ 結 果 実 社 会 と リ ン ク し た 研 究 ・教 育 多元ビッグデータ解析に基づく知の創出研究拠点事業 6
  • 7. /28 ビッグデータ解析による新たな知の創出 知見 知見 高速,広帯域ネットワーク ビッグデータ データデータ 統計 解析 研究 • 統計解析技術の高度化に力点 • 具体的研究対象と解析研究が乖離 • 成長的なループが脆弱 知見 知見 高速,広帯域ネットワーク ビッグデータ データデータ 統計 解析 研究 バイオ情報,物質情 報,生活社会情報 • 知の創出の研究を目的とし,バイオ、物質、情報の研究を新たなステージに。 例えば, • 「個」を対象にした新たな生命科学,物質科学,情報科学への展開.種レベルか ら個々の細胞レベルの個体差,個人差の研究を実施,個人のデータ,状況に合わ せて,その個人に最適な多元の専門知識や推論・予測知識の提供 • 未知化学物質の予測,合成経路予測,代謝ネットワーク上の位置の予測 • 実データのフィードバックによる研究の成長、データの成長を実現するループ を構築 今までのビッグデータ解析研究 NAISTのビッグデータ解析による 新たな知の創出研究 現在のビッグ データ研究 HOW型知識 WHY型知識 情報統合 推論,予測新たな研究 ステージへ 新たな知の 創出の研究 7
  • 8. センサー データ Blogs, E-mail Web Data Docs, PDFs Images/ Videos 高速ネットワーク データ、アクセス クローリング、フィルタ リング データセンタ NoSQL, Hbase, Hive 大規模分散フレーム ワーク Hadoop, Map Reduce 大規模Webアプリケー ション、HTML5 メタデータ設計 スケジューリング 開発言語、SDK 大規模プロジェクトマネジメ ント、PMBOK ネットワーク・データ セキュリティ 非構造化・ストリー ムデータ処理 分散OS,ファイル、 並列プログラミング 翻訳、意味解析 知識獲得構造化 評判、信頼性分析 テキスト、画像、音 声 超大規模 パターン認識、機 械学習 データマイニング Linked Data, 質問応答 マルチレイヤオーバーレイ ネットワーク サイバーセキュリティ プライバシー保護技術 メディア情報処理系研究課題 コンピュータサイエンス系研究課題 プログラマ科学者 コンサルタント ビジネスユー ザ 一般ユーザ アプリケーション 質問応答, 検索 レコメンデーション ナビゲーション 知識獲得・抽出 関連分析 信憑性分析 多元ビッグデータ解析システム 生体関連物質 機能構造要素 異性体・化学反応 生体関連物質, 構造機能相関 物性・構造 グラフマイニング 化合物精密3D構造 超分子複合体 合成法予測 物質情報: 環境,エネルギー 問題 化学式 1次元 新規 機能性 材料 環境適合性 材料 開発 物質情報 Web, blog, twitter, chat 対話データ 多言語Text 動画、youtube 生活、社会情報: ライフ、イノベー ション基盤 テキスト、 音声,音響 1次元 社会、経済、生 活に関する新た な知識の収集, 発見,構造化, 分析,翻訳,変 換,検索,推論, 予測、可視化、 質問応答 技術開発 生活社会情報 ゲノム多様性 転写情報 発現情報 タンパク質精密3D構造 超分子複合体 1次元 genomes バイオ情報生体情報 医療、食料、生命 問題 ゲノム設計 細胞設計 新規機能性 材料探索 3次元 Metabolome Interactome 静止画 写真 三次元インタラクショ ン、モーション 三次元構造、ビジョン 3次元 3体関係 2次元 2体関係 2次元 2体関係 3次元 3体関係 代謝ネットワーク 遺伝的相互作用 2次元 Transcriptome Proteome 82015/3/20 Satoshi NAKAMURA@AHC,NAIST
  • 9. 成長的ループにより産学連携 多元ビッグデータ 解析と新たな知の 創出の研究と教育 実世界 データ蓄積 実利用者 実アプリケーション サービス公開 データベース公開 性能向上 新サービス公開 • 利用者の実使用詳細ログ • 利用者の評判,リクエスト 増加 増加 ネットワーク型 サービス • 新たなサイエンスデータに関する知見 • 新たな特性,分析法のレポート • フィードバック • 実ユーザ、実世界のデータの大規模な蓄積 • 持続的に性能改善を行うループ • 実ユーザの要望による迅速な新技術研究 • 社会還元 (産学アドミニストレータ) • ネットワーク型のオープンな試験サービス、 データ公開による世界レベルのプレゼンス • 完成度の高い技術、データの技術移転 • 学生主導の新サービス開発と起業の促進 • 教育 (教育アドミニストレータ) • 社会のニーズにリンクした研究開発による 実学教育(Nifty, NEC) ネットワーク型成長的ループの構築による、 • 実社会にリンクした異分野融合研究開発、教育 • リアルタイムで世界に向けたトライアルサービス、 データ公開 産学アドミニストレータ 研究・教育アドミニストレータ データ増殖 最初から実アプ リケーションを想 定し社会にリン ク,成長的に研 究,データ蓄積 9Satoshi NAKAMURA@AHC,NAIST
  • 10. 多元ビッグデータ解析に基づく知の創出研究拠点事業 体制図 自然言語処理、意味解析、 評判分析、情報分析 松本研究室 テキスト、音声、 大規模パターン認識、 多言語翻訳 中村研究室 機械学習 池田研究室 データベース 加藤研究室 大規模画像処理 横矢研究室 佐藤研究室 環境学習 杉本研究室 環境センサ 萩田研究室 分散コンピュータアーキテクチャ 中島研究室 サイバーセキュリティ 山口研究室、藤川研究室 ユビキタスネットワーク 安本.伊藤研究室 高速ネットワーク 岡田研究室 ディペンダブル計算 井上研究室 ソフトウェア 松本研究室 飯田研究室 社会実験サービス リアルタイムサービス データ蓄積 自動学習 E-Scienceビッグデータ データ: 物質情報データ 処理: 化学式の類似構造発見 有機物の立体構造の類似性 異性体による性質予測 グラフマイニング、立体構造予測 データの可視化 ニフティ株式会社 Nifty Forumデータ 近畿日本鉄道 乗降・購買履歴 E-Science ビッグデータ データ: 植物、動物、微生物、タンパク質、代謝 物質、次世代型シーケンサ、質量分析 計、HT実験データ 処理: データマイニング、プロファイリング、 データの可視化(DNAの塩基配列の 部分類似性、入れ替わり解析、生物の 祖先、分化の解明等) ヒト健康-薬/食用生物の 関係オミックスプラット フォーム 金谷研究室(情報) 大腸菌DNAデータ解析 細胞内ネットワーク解析 森研究室(バイオ) 研究支援者(学生) 次世代シークエンサ、質量分 析、オミックスデータ解析 倉田准教授(バイオ) 研究支援者(学生) 半導体、生物超分子 データベース、解析 石河准教授(物質) 研究支援者(学生) 1次元から3次元時空 間データの統合的知 識収集、知識発見,構 造化、可視化、相関, 翻訳、変換、検索、推 論、情報統合、質問応 答、インタラクション、 質問応答技術 エナジーハーベスティング データベース 上沼助教(物質) 研究支援者(学生) 大規模システム管理 笠原研究室 10 全体統括 拠点リーダ: 中村教授 研究・教育アドミニストレータ: 鈴木特任准教授(兼務)、 産学アドミニストレータ: 久保教授, 西浦特任教授(産学連携) 多元ビッグデータ解析 に基づく知の創出研究拠点 中村教授: 研究統括 (兼務) 鈴木特任准教授: 多元データ融合化研究 特任助教 : 多元データ融合システム設計、研究 プロジェクト参加者数 • 教授 20名 • 准教授 22名 定員 21名 特任 1名 • 助教 32名 定員 30名 特任 1名 • 研究支援者 博士学生 6名 物質創成科学研究科 バイオサイエンス研究科 情報科学研究科 外 部 機 関 ・ 民 間 会 社 NAIST課題創出型共 同研究プロジェクト (ヤンマー、サント リー、ダイキン) 京都府 HEMSデータ
  • 11. H26 H27 H28 H29 H30 H31 研究計画 研究設備 導入計画 詳細化 体制構築 データ収集システム構築 データ収集開始 初期検討 研究の高度化 解析システム構築 初期評価、改良 初期評価 高度化 • 全体システム統合と評価、実証実験 • 試験サービス構築、運用トライアル • 海外のプロジェクトとの連携 • 国際会議における発表、ワークショップ・ 技術展示等 • 成果展開、産学連携推進事業 全体 研究計画の詳細 化、要素技術基 盤研究の開始 知識獲得・構造化、データマイニング、画像・音声超大規模パターン認識、情報信頼性分 析、言語翻訳・意味解析技術、センサー情報統合、事象予測などの研究課題 基盤研究 高度化 初期評価実験 検証、評価、再実装 総合評価 多元ビッグデータを対象とした解析 技術と生活社会情報の解析 生活社会情報およびビッグデータ解析基盤:メディア情報処理系課題 ビッグデータ解析基盤:コンピュータサイエンス系研究課題 知識収集・蓄積イ ンフラ初期システ ム設計,導入 大規模分散フレームワーク、ネットワーク、クローリング、セキュリティなど多言語多元ビッグデータ処理アーキテクチャ基盤 研究開始 研究の高度化 多元ビッグデータ解析イン フラシステムの初期実装 研究の検証、 評価、再実装 技術などの実証実験と運用 知識収集・蓄積イ ンフラ初期システ ムの設計と導入 化学・材料科学・機能性生体物質関連ビッグデータを対象とした知識収集、データ解析、可視化、融合技術基盤 化学、材料、機能性生 体物質研究試行 融合研究試行と 対策検討 ビッグデータの構 築と統合技術 研究の検証、評 価、再実装 統合解析技術の評価と持 続実施体制構築 物質情報 バイオ情報 データ収集・蓄積 インフラ初期シス テムの導入と研究 開始 インターネットのデータ群とインハウスで産生を行う多元バイオデータの統一的な収集、蓄積、管理、解析技術基盤 統合解析、データマイ ニング研究開始 研究高度化、インハ ウスデータ統合 トランスクリトーム、代 謝、メタボローム解析 研究の検証、評 価、再実装 高度化及び多層統合解析 の持続実施体制構築 11
  • 12. 応用事例①(バイオ) E-Scienceに関する 深い質問応答 の実例 (遺伝子情報のマイニング) 環境・状況 個人情報に応じた 知識の獲得 (位置情報、 環境映像、 環境音、音声、 個人情報) 学習情報 文献情報からの知 識獲得データベー ス ○このDNA系列の同一あ るいは類似の系列は どこに存在するか (Where) ○このDNA系列はどのよ うな機能に関連してい るか(What) ○このDNA系列はどのよ うな環境変化、進化と 関連しているか、どう 関連したか (When, Where, How, Why) ○このDNA系列は実際の 生活にどう影響してい るか、どの様は病気に 関係しているか、薬と の関係はどうなってい るか。 (What, Where, When) 網羅的蓄積実験データ Transcriptome Proteome Metabolome Interactome データベース 多階層 ネットワーク解析 アンビエント 専門情報 学術論文 DB Transcriptome DB Proteome DB Interactome DB Genome DB データマイニング 12
  • 13. 応用事例②(医療情報の提供) 医療情報に関する 深い質問応答 の実例 環境・状況 個人情報に応じた 知識の獲得 (位置情報、 環境映像、 環境音、音声、 個人情報) Web一般情報 多言語のニュース Twitter Blog Wikipedia 専門情報 医師会等の情報 医療情報サービスMinds 医療情報ニュースなど (http://www.medical-it- link.jp/news/) ○身体の調子が悪いがど うすればよいか、病院 にいくべきか(How) 近くに病院はあるか (Where)開院している か(When) ○この薬は安全か、どう 服用すれば良いか、こ の薬を服用して何か危 険なことは起こってい ないか (What, Where, When) ○こういう症状が出ている が、どの病院、どの診 療科に行けば良いか。 (What, Where, When) ○なぜ、このような症状、 病気になったのか。 (Why) 信頼度計算 言語翻訳 知識抽出 知識構造化 知識提示 アンビエント 13
  • 14. 応用事例③(災害への対応方法) 原子力発電所からの放射線の影響に関する生活安全情報(ニュース、放射 線計測情報、個人環境、Twitter などを)対象にした深い質問応答 の実例 環境・状況 個人情報に応じた 知識の獲得 (位置情報、 環境映像、 環境音、音声、 個人情報) Web情報 (多言語のニュース Twitter Blog Wikipedia) 公開センサ 情報等 (http://www.mext.go.jp/a_me nu/saigaijohou/index.htm ) ○原発で爆発があったら しい。いま、ここで、私 は、何をどう警戒すれ ばよいか(How) ○明日、学校の校庭、 プールは安全か。どう 対応すればよいか (How) ○なぜ、放射能は怖いの か(Why) 怖さをどう子供に教え たらよいのか(How) ○夕食の食材を産地、放 射能の影響を考えて 買いたい(What) どこのスーパーに行け ばよいか(Where) ○魚を食べたいが、いま、 何処のどういう魚が安 全か(What) 信頼度計算 言語翻訳 知識抽出 知識構造化 知識提示 アンビエント 14
  • 15. /28 研究の新規性 新たな知の創出により、 これまでのWhat, Who, When, Where に加えて,ゼタバイトに拡張するインター ネット上の世界中のブログ,ソーシャルメディア,センシングデータ等の情報か らHow, Why 型の知識を抽出し,利用者個人のデータ,ライフログ,状況に合わせ て,その個人に最適な多元の専門知識や推論・予測知識をリアルタイムに提供す る新たな情報科学研究を世界に先駆けて生み出す. 15 • 情報がコアとなり,従来独立していた,メタボロミクスと化学物質データベース を多元化解析で高度化することで生物・化学研究者だけではできなかった,未知 化学物質の予測,合成経路予測,代謝ネットワーク上の位置の最適化など,新た な生命科学と物質科学の融合,学術分野を世界に先駆けて開拓できる. • 次世代シーケンサ,質量分析計により,これまでになかった速度と量のデータが 生産され始めている.本研究により,生物学者だけでは処理できなかった速度と 量の解析を可能とし,種レベルから個々の細胞レベルの個体差,個人差の研究を 実施,「個」を対象にした,生命科学,物質科学,情報科学へのシフトを実現す る.例えば,生物工学では人工細胞合成による物質生産の実現,医療,創薬,環 境ではテーラーメード医療の実現を可能とする.
  • 16. 産業分野への貢献 金融分野 – マーケティング分野 • 住宅ローン申し込み顧客推定、生命保険顧客推定、銀行商品の組合せ、ダイレクト メール発送先選定 – 業務特化分野 • 自動車保険設計、社債格付予想、クレジットカード不正使用パターンの抽出 流通・小売分野 – 優良顧客発掘、新製品販売予測、商品ヒット要因分析、消費行動予測 製造分野 – HPの顧客意見分析による製品開発、クレーム分析と品質改善、製造工程の改良、 故障発見、故障診断 通信分野 – HP閲覧履歴からの顧客プロファイリングと推薦、電話回線管理と負荷、障害分 析・予測、電話網マーケティングと通信トラフィック分析、通話不正利用の発 見、計算機不正使用の発見 製薬、医療 – 化合物分子構造と生理活性の相関分析、遺伝子発現と生理学効果の相関分析、 科学的根拠に基づく医療知識獲得 2015/3/20 Satoshi NAKAMURA@AHC,NAIST 16
  • 17. 最後に データ中心科学 – 新たな科学を生み出せるか ビッグデータアナリティクス – クラウド型の登場で大規模データの収集が可能 – だが、どう分析して良いか分からない これまでと何が違うのか – 大規模データの集積、計算が可能に(NoSQL, GPU) – 機械学習、データマイニングアルゴリズムの登場 成功の実例 – Amazonの推薦システムなど多数 – 今後はセンサーデータと言語データのリンクに基づく解析も あらたな知を生み出すためのプロジェクト – 産学連携、人材育成、新規研究が目標 – これからは連携してデータを集積することも必要 2015/3/20 Satoshi NAKAMURA@AHC,NAIST 17

Related Documents