【論文まとめ】Comparing Abstractive Summaries Generated by ChatGPT to RealSummaries Through Blinded Reviewers and Text ClassificationAlgorithms

本文4pのプレプリントです。
・CNNのニュース記事(50個)の要約を生成→人間が書いたかChatGPTが書いたか分類
・2人のネイティブスピーカーによる分類→正解率50%以下
・BERTベースのモデルで分類→正解率90%
https://arxiv.org/pdf/2303.17650.pdf

感想

  • 人間の判定者が少ないような気がするけど、2人くらいで十分なのかな?
  • BERTベースの分類モデルはどうやって学習したんだろ?
  • 人間にはほとんど区別がつかないのに深層学習モデルでは判別できるって面白いなと思う。

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事

コメント

この記事へのコメントはありません。

CAPTCHA