AIサジェスト機能「GitHub Copilot」が炎上 - GitHub自体の使用中止の呼びかけ

S 20220703 93626

フリーソフトウェア、オープンソースソフトウェアプロジェクトを支援する組織であるSoftware Freedom Conservancy(SFC)は6月30日(米国時間)、「Give Up GitHub:The Time Has Come! -Conservancy Blog-Software Freedom Conservancy」と題したブログ記事を公開し、メンバープロジェクトやコミュニティのメンバーにGitHubを避けるよう促し、FOSSプロジェクトがGitHubから移行するのを支援する長期計画を実行することを発表しました(Hacker News)。

既存のメンバープロジェクトに移行を強制することはないものの、移行を計画していない新規メンバープロジェクトは今後受け入れることはないとのこと。

GitHubに見切りを付けた最大の理由は、Microsoftとその子会社であるGitHubが最近一般提供を開始した、AIによるコードサジェスト機能「GitHub Copilot」にあるとされています。

MicrosoftやGitHubに質問し、いまだ回答が得られていない問題点として以下の項目がリストアップされています。

  • GitHubのCEOが述べた、「(1)公共データでMLシステムをトレーニングすることはフェアユースであり、(2)出力はコンパイラと同じようにオペレータに帰属する?」という主張に関して参考にした判例があるのか?法的な分析は?
  • どんなコードでもモデルを訓練し(そして、ユーザーがそのモデルに基づいてコードを生成することを許可し)、いかなるライセンス条件にも拘束されないことが許されるなら、なぜCopilotのモデルをFOSS上でだけ訓練することにしたのか? 例えば、なぜMicrosoft WindowsとOfficeのコードベースはトレーニングセットに含まれていないのか?
  • Copilotに使用されたトレーニングセットに含まれていた、著作権者名やGitリポジトリの名前などのライセンスのリストを提供できるのか?そうでない場合、なぜこの情報をコミュニティから隠しているのか?

SFCは、GitHubが回答を拒否していることから、結果として得られたモデルを正確に再現する能力がなく、誰の著作権をいつ、どのように侵害したかという答えを実際には知らないのではないかと推測しています。

CopilotやGitHubのコアホスティングサービス、そしてほとんど全ての分野で、GitHubの行動は同業他社よりもかなり悪いとのこと。Amazon、Atlassian、GitLab、その他の営利目的のホスティング業者が完璧な行為者ではないものの、GitHubの行動を同業他社の行動と相対的に比較すると、GitHubの行動はずっと悪いことがわかると指摘しています。

スポンサーリンク