【一瞬】JupyterLabがフリーズした時の対処方法
こんにちは。最近、Jupyter Labをコンソールから起動すると画面がフリーズしてしまう事象に遭遇しました。 根本原因は分からなかったのですが、意外な方法で解決することができたので書いておきます。 事象 Anacond...
こんにちは。最近、Jupyter Labをコンソールから起動すると画面がフリーズしてしまう事象に遭遇しました。 根本原因は分からなかったのですが、意外な方法で解決することができたので書いておきます。 事象 Anacond...
こんにちは。本日は機械学習モデル構築にあたり、悩みどころである、学習アルゴリズムの選び方について、良いドキュメントを見つけたのでご紹介しようと思います。 まさにこういうものが欲しかった・・!そしてもっと早く見つけておきた...
こんにちは。本日は、Scikit-Learnを使って機械学習モデル構築時の交差検証を実装する方法をご紹介いたしますす。(交差検証の理論は分かっている前提で話を進めます) 方法1:sklearnのcross_val_sco...
こんばんは。本日は、データ分析Tipsということで、最近知った(遅ればせながら・・)便利コマンドをご紹介したいと思います。 value_counts()のnormalizeオプションを利用する 下のデータは公開されている...
こんばんは。前回まで少し小休止で旅行記を書いていましたが、再び本題の機械学習の勉強を進めていければなと思います! 兼ねてから、普段使っている機械学習アルゴリズムの仕組みや特徴を復習して頭に入れておきたいなと思っていたので...
こんにちは。本日は、データサイエンス・機械学習を学ぶに当たって、これはぜひ読んでおくべき!と思う本を主観に基づいてご紹介したいと思います! 私自身も、アプリケーションエンジニアとしてキャリアを進めていたところから、1年間...
こんにちは。 今日はツイートデータを用いてテキストのネガティブ/ポジティブ分析に挑戦してみたいと思います! はじめに:分析対象のテキストデータ(Twitterデータ)を取得する 今回、分析対象のテキストデータにはTwit...
こんにちは。最近自然言語処理を勉強していますが、今回は、形態素解析を行って分割した各単語を原型に戻す方法について整理しておきたいと思います。どうやら形態素解析を行った後に、単語の種類数を減らすために単語を原型に変換すると...
こんにちは。今回は、テキストデータ分析の切り口の1つとして、品詞毎の頻出ワードの特定を試してみましたので、その方法をまとめておこうと思います。分析対象データには、ツイッター上の「新型コロナウィルス」を含むツイートデータを...
こんにちは。最近は、SNSデータをもっと自由に分析できるようになりたいなぁということで関連した記事をよく書いていますが、今回もそのシリーズになります! 前回書いたTwitterデータの分析記事でご紹介した方法の発展形とし...
こんばんは。今日はTwitter APIを使ったスクレイピングに挑戦したいと思います。Twitterのデータを自由に取得できるようになったら今後色々なデータ分析で幅が広がりそうです。 この記事では、Twitterのデータ...
こんばんは。いつもデータ分析で愛用しているJupyterLabのメジャーバージョンが先月上がっていたことに今更ながら気づきましたので、私のJupyterLabもアップグレードしてみようと思います。 また、タイトルとは関係...
こんにちは。今日は、自然言語に関する話題です。 自然言語処理はあまりこれまで触れてきておらず、RDBに蓄積されたテーブルデータの分析・機械学習モデリングがメインだったのですが、最近テキスト文から説明変数を抽出できたら良い...
こんにちは。Yutaro@年末合宿中です。この年末は、これまで耳にしていたけれど実際に使ってみれていなかった技術を色々と触ってみようと思っています! その第一弾がSparkというわけです。 現在はアドホックなデータ分析や...
こんにちは。本日はTensorflow Hubの使い方について解説してみたいと思います。 最近の一連の機械学習関連の記事を書いているきっかけにもなっているのですが、自然言語処理の勉強にあたって必要になった情報や知識を整理...
こんばんは。本日は、自然言語処理モデルのBERTについて調べて分かったことをまとめておこうと思います。 最近、テーブルデータ分析を少し離れて自然言語処理(NLP)を勉強し始めているのですが、KaggleなどでNLPのコン...
こんばんは。本日は転移学習(Transfer Learning)とファインチューニングについて調べたことを備忘メモを残しておこうと思います。 最近、自然言語処理を勉強し始めたのですが、書籍などをみていると、この「転移学習...
こんばんは。最近仕事でTableauを使う機会があったので、苦戦したことを纏めておこうと思います。この記事ではドーナツチャートの作成手順を整理します。 Tableau、使ってみると簡単なグラフがとっても作りづらい・・・と...
こんばんは。この記事では、Microsoft Azureでデータ分析環境を利用できるようになるまでのステップを解説します。 自分がセットアップした時の手順を備忘として書きました。それでは早速まいります! 2022年2月、...
こんばんは。本日は、Microsoft Azure AutoMLをローカルのJupyter上で使えるようにしたいと思います。 Azure Machine Learning AutoMLとは? Microsoft Azur...
こんばんは、今日はMicrosoft社が開発したBIツールSand Danceを使ってみようと思います。 SandDanceの歴史 Sand Danceは2011月にMicrosoft社の研究機関であるMicrosoft...
こんにちは。本日はローカル環境に機械学習環境を構築する手順を整理します。10分でやってしまいましょう!ということなのでもうサクサクと手順を説明していきます! また、これから説明する手順はMac/Windowsともに共通フ...
こんにちは。今日は決定木モデルのふるまいの解釈に使われる変数重要度について、自分でも理解が少しあいまいだったので整理してみようと思ってこの記事を書いています。 同じ疑問を持たれている方のお役に少しでも立ちましたら幸いです...
こんばんは!今日はモデルによる予測結果の解釈性を向上させる方法の1つであるSHAPを試してみたいと思います。私自身機械学習・データサイエンスを絶賛勉強中ですので、記事内容に謝りがあればご指摘いただけますと幸いです。 実ビ...
Light-GBMの”boosting”ハイパーパラメータで”dart”というものがあり、しかもKaggleなどのコンペティションではこのオプションが使われていることが多い...
こんばんは。 本日はAWS Sage Makerで機械学習環境を構築したときの手順を整理しておこうと思います。 AWS Sage Makerとは? データ分析から機械学習のモデル構築、デプロイまでの一連のプロセスに必要な...
普段はテーブルデータ分析がメインで、ニューラルネットワークは昔本で読んだっきり、実務で使う機会もなく忘れかけていたので、久々に復習しようと思い、記事にまとめておくことにしました。練習にはCIFAR-10のデータセットを使...
業務の中で時系列データ分析を行う機会があったので、ド素人目線で躓いた基礎知識をまとめておこうと思います。勉強はじめたての素人のため、間違っている記述があればコメントいただけますと幸いです。 *今は簡単な言葉でしかかいてい...