最近のGitHubの流行は圧倒的で、毎日さまざまなプログラミング言語を利用したオープンソースのリポジトリが増え続けています。
本日紹介する「Common words」はこの、GitHubに公開されているオープンソースのリポジトリに含まれるソースコードを利用して、プログラミング言語ごとに、どのような単語が使われているかを可視化するWebサービスです。
Common wordsを利用すると、例えば上の図のようにJavaScriptでは、「this」や「function」「if」といったおなじみのワードが多く使われていることが一目で理解することができるのです。
目次
言語切替
JavaScript以外のグラフを表示したい場合、左上のリストボックスを使ってプログラミング言語を切り替えることができます。
▲Ruby言語を選ぶと「end」や「do」、「def」といったRubyプログラマならばお馴染みの単語がリストアップされていることがわかります。
全体がRubyの紅玉ロゴの形になっているところも注目ポイントかもしれません。プログラミング言語が識別できるように背景にも工夫が凝らされているのです。
用例表示
さらに右側のグラフ部分で単語をクリックすると使用例を表示できます。
▲「Engine」がどのような文脈で使われているのかがわかります。
まとめ
Common wordsは2016年の中期から下期にかけて、300万のオープンソースリポジトリから抽出したデータを利用し、グラフ化したものと説明されています。ソースコードもGitHubで公開されていますので興味がある方は参照してみても良いでしょう。