Question 1

什麼是同形字？

Accepted Answer

同形文字是一種看起來像來自不同腳本或編碼的另一個字符的字符，例如類似於拉丁語“a”的西里爾文“а”。攻擊者在欺騙網域、使用者名稱和訊息中使用它們。該工具用代碼點和替換來顯示這些字元。

Question 2

這與 Unicode 標準化有何不同？

Accepted Answer

Unicode 規範化（例如 NFKC）以標準方式折疊相容性和寬度變體。該工具將 NFKC 與一個小的明確易混淆映射相結合，以便您了解每個字元被標記的原因 — 這比普通的 unicode 標準化工具傳遞更有用。

Question 3

嚴格的 ASCII 模式會改變合法的非英語文字嗎？

Accepted Answer

嚴格 ASCII 回退會取代捆綁的易混淆映射中出現的字元或 NFKC 下的變更。其他非 ASCII 字母保持不變。如果合法文字包含這些映射字符，則仍然可能會發生更改，因此請檢查分析清單。

Question 4

我的文字會發送到伺服器嗎？

Accepted Answer

不會。頁面載入後，偵測和轉換僅使用 JavaScript。此易混淆轉換器不會上傳您的貼上進行分析。

Question 5

這能抓住所有惡搞嗎？

Accepted Answer

不。覆蓋範圍是確定性的且基於地圖，而不是機器學習。它有助於常見的相似字元技巧，但並不是完整的安全審核。

Question 6

生成同形文字模式有什麼作用？

Accepted Answer

它將輸入中的 ASCII 字母和數字替換為來自用於清理的相同捆綁映射的確定性相似值，這對於在授權環境中建立測試字串非常有用（例如審核 QA）。它不是為了模仿或繞過保護。

同形字轉換器 — 偵測並清理 Unicode 易混淆字元

這個同形文字轉換器的作用