Fumihiko Kimura (@fumihiko__k) 's Twitter Profile
Fumihiko Kimura

@fumihiko__k

データサイエンス・AIの展開による日本のデジタル競争力向上を目指し、有用な関連情報や、ビジネスシーンでのTips、Dataikuについてを分かりやすく発信していきます。
資格:Dataiku諸々・G検定・応用情報・Java・Oracle etc..
経歴:#Oracle→#Accenture→#Dataiku

ID: 1648849186279018497

calendar_today20-04-2023 00:41:13

561 Tweet

379 Followers

265 Following

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 ②Train/Testデータの縦結合 特徴量の前処理を実施するに当たって、Train/Testデータの形式を揃える目的で最初に縦結合します →次回以降で本題のデータ探索や前処理を実施します🙌 #dataiku #機械学習 #AI

佐藤 豊 (@fajoa) 's Twitter Profile Photo

AI基盤の「データイク」が日本で攻勢、2026年までに資格保有者3000人目指す ( 日経クロステック) xtech.nikkei.com/atcl/nxt/colum… 1. 資格保有者拡大 - 現在の約500人から2026年末までに3000人へ増加 - 半数を販売パートナーの技術者から、半数をそれ以外で育成 -

佐藤 豊 (@fajoa) 's Twitter Profile Photo

「AIの民主化」を進めよう 佐藤豊氏:日本経済新聞 朝刊の私見卓見で取り上げてとらきました。Tableau時代、Salesforce時代に続き3回目。データの可視化→データリテラシー→AIの民主化(今回)です。 #日経新聞 #日本経済新聞 #Dataiku #AIの民主化 nikkei.com/article/DGXZQO…

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 コンペ期間が終わったので改めて処理内容を動画で投稿していきます! ②データ前処理 Age列のデータ処理 ・30歳や三十七才などの全/半角や漢数字が混在 →今回はLLMを利用してプロンプトエンジニアリングで一気に加工 →30代などの年齢層は後ほど検討👍 #dataiku #機械学習 #AI

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 ②データ前処理 Gender列の加工 ・femaleやMaleなど多くの表記揺れを確認 ・こちらもLLMに幾つかサンプルを添えて加工します →Dataikuだと赤背景で不正データを確認&プロンプトエンジニアリングもサンプルを見ながら簡単に実施できて便利です👍 #dataiku #機械学習 #AI

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 ②データ前処理 DesignationとProductPitched列のデータ処理 ・Gender同様多くの表記揺れをデータ探索で確認 ・今回は二つのカラムを一つのプロンプトで一気に加工 ・Json形式にして後で抽出し易くしてます →前回のGenderも一気に含めて良かったですね👍 #dataiku #機械学習 #AI

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 ②データ前処理 DurationOfPitchの時間単位の調整 ・数値と単位をカラム分割 ・分単位の行の数値に60を掛けて秒に揃える →Prepareレシピにて分割はクリック操作で、秒に揃えるのは関数の利用で完結🙌 #dataiku #機械学習 #AI

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

昨日「日本生物工学会」のバイオものづくりのシンポジウムにて講演させて頂きました! AI活用の推進に向けて研究データのデジタル化や、シェアリング、特許検索などなど、多くのヒントも得られた素晴らしい機会でした🙌 引き続き多方面で勉強させて頂きます! sbj.or.jp/2024/ #dataiku #AI

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 ②データ前処理 NumberOfデータの数値統合 ・2.0と200.0などの不正データのマージ ・半年に一度や2回などの不揃いなデータのマージ →今回は数も多くなかったのでそれぞれクリック操作でマージしました🙌 #dataiku #機械学習 #AI

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 ②MounthlyIncomeの加工 ・月収26.0万円の記載の標準化 ・26の数値の切り出し ・万円の表記があった場合は✖️10,000 →クリック操作と条件式でDoneです🙌 #dataiku #機械学習 #AI

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 ②Designation/ProductPitched/Customer_infoの加工 ・テキストデータとしてLLMを活用 ・Json形式で出力した結果を準備レシピでカラムに展開 →既/未婚や車の所持、子供の数などのデータをLLMを活用してデータ化🙌 (LLMレシピの使い方は過去の投稿参照) #dataiku #機械学習 #AI

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 ③機械学習 学習/予測データの分割 ・特徴量調整等で最初に結合したデータの分割 →スコア提出用の予測用データと学習用のデータに改めて分割してます🤚 #dataiku #機械学習 #AI

Yuki Nakamura (@yndatahaiker) 's Twitter Profile Photo

パーソルスイッチコンサルティング様の“はたらくWell-being”調査でDataikuを活用頂いています! “同じ性別、年代であっても「はたらく動機づけ」は異なることが明確になった”とのこと。 【業種別Work Switch Score調査2024】 prtimes.jp/main/html/rd/p…

パーソルスイッチコンサルティング様の“はたらくWell-being”調査でDataikuを活用頂いています!

“同じ性別、年代であっても「はたらく動機づけ」は異なることが明確になった”とのこと。

【業種別Work Switch Score調査2024】 
prtimes.jp/main/html/rd/p…
Yuki Nakamura (@yndatahaiker) 's Twitter Profile Photo

SIGNATEのRAG-1グランプリに初サブミット! もちろんDataikuを使って、ノーコード・ローノードで取り組んでます。 複数のLLMを使い分けたり併用したり比較したりできる点、前処理や後処理が簡単な点で改めてDataikuの使いやすさ実感中🐦 これから色々と試行錯誤してスコア上げていくぞぃ💪

SIGNATEのRAG-1グランプリに初サブミット!
もちろんDataikuを使って、ノーコード・ローノードで取り組んでます。

複数のLLMを使い分けたり併用したり比較したりできる点、前処理や後処理が簡単な点で改めてDataikuの使いやすさ実感中🐦

これから色々と試行錯誤してスコア上げていくぞぃ💪
Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024】 ③機械学習 予測モデルの作成 ・k-foldを利用した交差検証の設定 ・(特徴量内のリスケーリングやダミー変数化はデフォルト) ・アルゴリズムの設定(ハイパフォーマンスを最初に指定) →上記の設定のみでモデル作成します🙂 #dataiku #機械学習 #AI

Fumihiko Kimura (@fumihiko__k) 's Twitter Profile Photo

【SIGNATE Cup 2024(fin)】 ③機械学習 予測モデルの適用 ・作成したモデルを予測用データに適用 ・適用結果に対するソート →こちらで投稿は完了しました。 →後は今週末の表彰式などで勉強します🙌 #dataiku #機械学習 #AI

佐藤 豊 (@fajoa) 's Twitter Profile Photo

📢 【第6回】Data Haiker 🥾 スキルアップイベント開催決定! ✨ 「データ領域のアップスキルを目指す仲間たち」として、Data Haiker 🥾 の第6回イベントをお届けします! 🔍 Data Haiker とは?