【R言語】掲示板を利用して風俗嬢のランキングを作る + knitrを使ってhtml生成もやる

前回までスクレイピングして感情分析とかもやってました。掲示板のレスの感情分析(Google AnalyzeSentiment)を利用した風俗嬢ランキング作成 - saikeisai's diary ただ、感情分析をやって単純に足すと頻度で得られたランキングと同じになってしまったので今…

掲示板のレスの感情分析(Google AnalyzeSentiment)を利用した風俗嬢ランキング作成

以前、単純に掲示板のレスに発生頻度からランキングを作りました。 掲示板をスクレイピングして風俗嬢のランキングを作る - saikeisai's diary また、Googleの感情分析をRから利用しました。 Google Cloud Natural Language APIの日本語の感情分析(analyzeSe…

Google Cloud Natural Language APIの日本語の感情分析(analyzeSentiment)をRから使ってみる

最近、Google Cloud Natural Language APIの感情分析が日本語に対応したらしい。 今回はちょっと使ってみたのでそのコードを載せるだけである。 Rでやってみるが、どの言語でもできると思う。 Google Cloud PlatformのAPI_KEYを持ってない人は登録する必要が…

掲示板をスクレイピングして風俗嬢のランキングを作る

概要 最初に概要を述べます。 近年風俗業界もネットでの広告に力を入れている。 代表的なサイトとして、cityheaven, pureloversなどがある。しかし、レビューサイトは一部の地域や業種(fucolle, atarijo, kan-deli.net)ではあるものの、未だ統合的な風俗レ…

爆サイ(bakusai)のスレをRのrvestを用いてスクレイピングする

これまで2chやしたらばをスクレイピングしてきた。 2chのスレをRのrvestを用いてスクレイピングする - saikeisai's diary pink.2chのスレをRのrvestを用いてスクレイピングする - saikeisai's diary したらばのスレをRのrvestを用いてスクレイピングする - s…

pink.2chのスレをRのrvestを用いてスクレイピングする

前回 2chのスレをRのrvestを用いてスクレイピングする - saikeisai's diary 2chのpinkではstatsがないためそのままだとスクレイピングできないということだった。 今回pink.2chのスクレイピングする。 今回も、スレッドのURLを与えた際にスレッドタイトルと…

2chのスレをRのrvestを用いてスクレイピングする

前回したらばのスレをRのrvestを用いてスクレイピングする - saikeisai's diaryしたらばでやってみたが今回は2chでやってみる。ちなみに、xpathなどの指定はchromeのdeveloper toolでcopy xpathというのができるのでそこから試行錯誤しています。今回も、ス…

したらばのスレをRのrvestを用いてスクレイピングする

Rにはrvestというスクレイピングする際のパッケージがある。 しかし、そのパッケージを用いて2chやしたらばなどのスレをスクレイピングをした記事は見当たらない。 (他の言語を用いてなされている記事もあるがhtmlに対して正規表現を用いて取り出しているの…

Mathematical Formulation of Bingo Probability and MonteCarlo Simulation(R)

This article is poor translation of my japanese articles.There are a few papers related probability of Bingo games."A New Look at the Probabilities in Bingo"、Some Probability Problems Concerning the Game of BingoHowever, I cound not find …

超幾何分布を利用してのビンゴの確率

前回saikeisai.hatenablog.comの続きです。ビンゴの確率をちゃんと計算することを考えてみる。 まずは、のビンゴのマスとする。 最大の数を(75であることが多い)、呼ばれた番号の数をとする。 かんたんのために、まずはフリーマスなしで考える。 例えば、…

Rを用いてビンゴの確率について

ビンゴ(bingo)する確率について調べてみたけどあまりよくわからなかった。 とりあえず5×5でフリーマスありで、10000回(コードでは人数になってるけど)やってみた結果を添付します。 細かい結果を見てみると、mizutaの結果と少し異なり、 dinとほとんど同…