Python 計算語意相似度

May 16, 2025

要怎麼用計算的方式,來測量兩組文字間的相似度呢?有兩種簡單的方法。

1. 編輯距離(Edit Distance / Levenshtein Distance)

2. Jaccard 相似度(Jaccard Similarity)

範例

以上兩個方法可以在 Python 的 textdistance 套件裡找到,首先先安裝套件:

pip install textdistance

接著用以下語法測試:

import textdistance

print(textdistance.jaccard("TRA Taipei Station", "Taipei Station TRA"))  
print(textdistance.levenshtein.normalized_similarity("Xiao Ming", "Hsiao Ming"))

也可以參考:textdistance,一个神奇的 Python 库! - 知乎