Detector de Similitud de Textos

Compara la similitud entre dos textos con tres algoritmos clásicos: Jaccard (conjuntos), Cosine (vectores de frecuencia) y Levenshtein (distancia de edición). Ideal para detectar plagios.

· 三算法并行 · 全程浏览器本地
文本 A (原文)0
文本 B (对比)0
算法说明
· Jaccard:词集交集除并集 —— 对改写顺序不敏感,但无视词频
· Cosine:词频向量夹角 —— 综合考虑词频分布,抄袭检测主指标
· Levenshtein:字符级编辑距离 —— 对同义替换敏感,段落级通用指标(大文本截 2000 字)
· 综合分 = Cosine×0.5 + Jaccard×0.3 + Levenshtein×0.2
· 适用于论文查重自查、公众号洗稿识别、短文本版权比对

Documentos · Herramientas relacionadas