応用情報技術者

【応用情報 令和元年春期 午前問63】データサイエンティストに求められるスキルセットに関する問題を解説

ビッグデータを有効活用し,事業価値を生み出す役割を担う専門人材であるデータサイエンティストに求められるスキルセットを表の三つの領域と定義した。データサイエンス力に該当する具体的なスキルはどれか。

扱うデータの規模や機密性を理解した上で,分析システムをオンプレミスで構築するか,クラウドサービスを利用して構築するかを判断し,設計できる。

事業モデル,バリューチェーンなどの特徴や事業の主たる課題を自力で構造的に理解でき,問題の大枠を整理できる。

分散処理のフレームワークを用いて,計算処理を複数サーバに分散させる並列処理システムを設計できる

分析要件に応じ,決定木分析,ニューラルネットワークなどのモデリング手法の選択,モデルへのパラメタの設定,分析結果の評価ができる。

データサイエンティストに求められるスキルセットに関しての理解を問われる問題。スキルセットの定義自体は問題文に乗っているので暗記していなくても理解があれば解けます。

3つのスキルセットとは

スキルセットはデータサイエンティスト協会のスキル委員会というところが定義したもので「ビジネス力」「データサイエンス力」「データエンジニアリング力」の3つがあります。定義することで若い人がどのようにスキルを鍛えるべきか、といったことがより具体的になるとのことです。

ビジネス力は「課題の背景を理解した上で、ビジネス課題を整理・分析し、解決する力」と定義されています。経営学的な力、といったところですね。

データサイエンス力は「人工知能や統計学などの情報科学に関する知識を用いて、予測、検定、関係性の把握およびデータ加工・可視化する力」と定義されています。数学的な力、といったところでしょう。

データエンジニアリング力は「データ分析によって作成したモデルを使えるように、分析システムを実装、運用する力」と定義されています。工学的な力、あるいはプログラマー的な力といったところでしょう。

以上を踏まえて、選択肢を見ていきましょう。3つのスキルセットのなかで「データサイエンス力(数学的な力)」を説明しているものを選べば正解です。

アの解説

扱うデータの規模や機密性を理解した上で,分析システムをオンプレミスで構築するか,クラウドサービスを利用して構築するかを判断し,設計できる。

構築・設計に関する話なので、プログラマー的な力、つまりはデータエンジニアリング力の説明となっています。したがってアは不正解

イの解説

事業モデル,バリューチェーンなどの特徴や事業の主たる課題を自力で構造的に理解でき,問題の大枠を整理できる。

「事業モデル」「バリューチェーン」といったワードは、経営学方面の用語ですね。経営の特徴や課題を理解する力、つまりは経営学的な力なので、ビジネス力の説明になっています。したがってイは不正解

ウの解説

分散処理のフレームワークを用いて,計算処理を複数サーバに分散させる並列処理システムを設計できる

システムの設計の話なので、プログラマー的な力の話ですね。つまりはデータエンジニアリング力の説明なのでウは不正解です。

エの解説

分析要件に応じ,決定木分析,ニューラルネットワークなどのモデリング手法の選択,モデルへのパラメタの設定,分析結果の評価ができる。

プログラム実装の前の手法選択・調整、プログラミングが吐き出した結果の分析など、数学的な理論の力が求められるので、データサイエンス力の説明となっています。したがってエが正解です。