文章類似度検出

オンライン文章類似度検出ツール:Jaccard 語集合、Cosine 語頻度ベクトル、Levenshtein 編集距離の 3 つの古典アルゴリズムで並列比較、文ごとに重複部分ハイライト、論文の剽窃チェック、記事コピー検出に最適。完全ローカル処理。

· 三算法并行 · 全程浏览器本地
文本 A (原文)0
文本 B (对比)0
算法说明
· Jaccard:词集交集除并集 —— 对改写顺序不敏感,但无视词频
· Cosine:词频向量夹角 —— 综合考虑词频分布,抄袭检测主指标
· Levenshtein:字符级编辑距离 —— 对同义替换敏感,段落级通用指标(大文本截 2000 字)
· 综合分 = Cosine×0.5 + Jaccard×0.3 + Levenshtein×0.2
· 适用于论文查重自查、公众号洗稿识别、短文本版权比对

ドキュメントツール · 関連ツール