圍繞 chardet 許可證變更的爭議在 AI 驅動的重寫之中

計算機工程師和程序員長期以來一直利用逆向工程來復制計算機程序的功能，而不直接復制受版權保護的代碼。然而，AI 編碼工具現在正在為這種“潔淨室”重寫過程引入新的復雜性，涉及法律、道德和實用考慮。

這些復雜性在上週變得尤為明顯，當時發布了一個新的 chardet 版本，這是一個廣泛使用的開源 Python 庫，用於自動字符編碼檢測。chardet 最初由 Mark Pilgrim 於 2006 年開發，並以 LGPL 許可分發，該許可對其重用和分發施加了嚴格的條件。

自 2012 年以來維護該存儲庫的 Dan Blanchard 上週發布了 chardet 版本 7.0。他將其描述為一個“從頭開始的 MIT 許可重寫”，並得到了 Claude Code 的幫助，使其“比以前的版本更快且更準確”。

在與《The Register》對話時，Blanchard 表達了他長期以來希望將 chardet 整合到 Python 標準庫中的願望。然而，許可限制、速度問題和準確性限制以前一直阻礙著此目標。在 Claude Code 的支持下，Blanchard 聲稱他在大約五天內成功升級了該庫，實現了性能的 48 倍提升。

儘管有了這些改進，但並不是每個人都對結果感到滿意。一位名為 Mark Pilgrim 的用戶在 GitHub 上出現，爭辯說新版本的 MIT 許可構成了對 Pilgrim 原始代碼的未經授權的重新許可。Pilgrim 主張作為經過修改的 LGPL 許可代碼，新的 chardet 版本應維持相同的 LGPL 許可。