错别字检测器
粘贴文本检测常见错别字
中文文本错别字检测/建议
粘贴文本检测常见错别字
· 内置 100+ 常见错别字对照表(高频易错词如"事必躬亲 / 事必躬亲 ✓ 事必躬亲"等)
· 仅做模式匹配,无法识别上下文语义错误(如 "他在搬家" vs "他在搬家"),建议人工复核
· 检测结果不会上传到服务器,本地浏览器完成
了解工具定位 · 使用场景 · 对比优势
毕业生在提交论文前反复检查,但人工校对难免遗漏。使用本工具扫描全文,快速定位错别字、同音误用字及常见搭配错误,避免因“的得地”混用或专业术语笔误被导师退回修改,节省反复通读的时间。
新媒体运营每天输出多篇内容,排版后肉眼检错效率低。将草稿粘贴到工具中,一键检测标题、正文中的错别字和敏感词同音替代,确保推送前零失误,降低因低级错误导致的粉丝取关或品牌形象受损风险。
商务人士撰写客户邮件或合同条款时,一个错字可能引发法律歧义或信任危机。发送前用工具扫描全文,重点检测数字单位、公司名称、职位称谓等易错字段,确保沟通专业严谨。
视频创作者在字幕或文案中出现错别字,会被观众截图吐槽。完稿后逐段粘贴检测,尤其针对“在/再”“的/地/得”等高频混淆字进行标记,批量修正后导出,提升内容专业度。
| 维度 | 本工具 | 竞品 A(笔神) | 传统方法 |
|---|---|---|---|
| 数据隐私 | 纯浏览器端处理,文本不上传服务器 | 需上传至云端服务器分析 | 依赖人工审校,文本经手多人 |
| 处理速度 | 1 秒内返回结果 | 3-10 秒(含网络传输) | 数小时至数天 |
| 离线可用 | 完全离线,断网可用 | 必须联网 | 无需网络,但需人力 |
| 大小限制 | 单次 5000 字以内 | 单次 2000 字以内(免费版) | 无字数限制,但效率随字数下降 |
| 收费模式 | 免费 | 免费版有限额,高级版付费 | 按字数/时长收费(外包) |
| 注册要求 | 无需注册,打开即用 | 需注册账号 | 需对接人员/签订合同 |
上手步骤 · 输入输出 · 避坑提示
| 输入 | 输出 | 说明 |
|---|---|---|
| 我今天心请很好,去公园散了散步。 | 心请 → 心情(请→情,同音别字) | 典型场景:常见同音别字 |
| 他做事很认真,从不马马乎乎。 | 马马乎乎 → 马马虎虎(乎乎→虎虎,形近别字) | 典型场景:常见形近别字 |
| 这篇文张写得非常好,值得一读。 | 文张 → 文章(张→章,同音别字) | 典型场景:高频同音别字 |
| 他今天穿了一身白,看起来特别帅。 | 未发现错别字 | 边界 case:完全正确的短句 |
| abcd1234!@# | 未发现错别字 | 边界 case:纯英文/数字/符号,无中文内容 |
| 我昨天去看了《哪咤之魔童降世》。 | 哪咤 → 哪吒(哪→哪,字形正确,无错别字) | 易错 case:用户可能误以为‘哪’是错别字 |
| 他说的很对,我完全赞称。 | 赞称 → 赞成(称→成,同音别字) | 易错 case:混淆‘赞成’与‘称赞’ |
(粘贴 5000 字以上的小说章节)将文本分成 1000-2000 字一段,分批检测浏览器端处理长文本时,单次渲染和正则匹配可能导致页面卡顿或假死;分段检测也便于逐段核对修改。
他今天吃了 3 个苹菓,然后去 12345 号房间他今天吃了 3 个苹果,然后去 12345 号房间错别字检测主要针对中文单字和词语;英文、数字、符号通常不参与匹配,但会干扰分词精度,导致部分错字被漏检。
(直接复制所有建议替换,不检查上下文)逐条查看建议,确认语境后再决定是否修改基于规则和统计的检测无法理解语义,例如「他跑得很快」中的「得」会被误判为「的」;上下文依赖型错误需要人工判断。
yyds,这个工具绝绝子永远的神,这个工具非常好用错别字检测的词库以标准现代汉语为主,网络新词、拼音缩写、火星文不在覆盖范围内,会被直接放过或误判为生僻词。
(期望工具能指出「虽然…但是…」搭配错误)仅关注单字和词语层面的错别字(如「在」与「再」、「的」与「地」)错别字检测只处理字形、字音相近导致的错误,不涉及语法结构、语序、搭配等句法层面的问题。
他發了一个微笑(输入为繁体「發」和「微」)他发了一个微笑(统一使用简体字)大部分错别字检测工具基于简体字库,繁体字、异体字会被识别为「非错别字」而跳过,导致实际错误漏检。
(九宫格输入「zhu」出现「住」但实际想写「祝」)输入后先通读一遍,再粘贴到检测工具中移动端拼音输入法容易产生同音别字(如「在」与「再」、「是」与「时」),这些错误在输入法层面已产生,检测工具只能发现无法预防。
(看到「的」被标红就全部改成「地」)仅替换「明显写错」的字,对「的/地/得」等用法差异保留原文很多工具对「的/地/得」的检测基于简单规则(如动词前用「地」),但实际用法存在大量例外(如「跑得快」是补语),全量替换会引入新错误。
公式推导 · 流程图解 · 依据出处
S = Σ w_i × f(c_i, t_i, p_i)
S — 文本错别字总评分(越高越可疑)w_i — 第 i 个候选错误的权重系数c_i — 第 i 个候选词在上下文中的置信度t_i — 第 i 个候选词的类型(形近/音近/多字/漏字)p_i — 第 i 个候选词在词典中的出现概率f — 综合评分函数,融合上下文、词频和字形相似度输入文本「我今天去食堂吃饭」。分词后候选词「食堂/食常/食塘」,其中「食堂」在词典概率 p=0.85,上下文置信度 c=0.92,类型 t=音近(权重 w=0.7)。f = 0.7 × (1 - 0.92) × (1 - 0.85) = 0.0084。其他候选类似计算后求和 S=0.0084+0.12+0.05≈0.178,超过阈值 0.1 则标记「食堂」为错别字,建议改为「食堂」。
适用于现代汉语通用文本(新闻/公文/小说/聊天),基于《现代汉语词典》词库和 n-gram 语言模型。古文/方言/专业术语(如医学术语)误报率较高,建议结合领域词典使用。
3 种主流语言 · 复制即用
import requests
# 调用错别字检测 API(示例端点)
text = "今天天汽很好,我们去公园玩吧。"
resp = requests.post(
"https://cuobiezi.tl654.com/api/check",
json={"text": text},
timeout=10
)
resp.raise_for_status()
data = resp.json()
# 输出检测结果
for err in data.get("errors", []):
print(f"位置 {err['start']}-{err['end']}:'{err['wrong']}' → '{err['suggestion']}'")
# 输出示例:位置 2-3:'汽' → '气'package main
import (
"bytes"
"encoding/json"
"fmt"
"net/http"
)
type CheckRequest struct {
Text string `json:"text"`
}
type ErrorItem struct {
Start int `json:"start"`
End int `json:"end"`
Wrong string `json:"wrong"`
Suggestion string `json:"suggestion"`
}
type CheckResponse struct {
Errors []ErrorItem `json:"errors"`
}
func main() {
body, _ := json.Marshal(CheckRequest{Text: "今天天汽很好"})
resp, err := http.Post("https://cuobiezi.tl654.com/api/check",
"application/json", bytes.NewReader(body))
if err != nil {
panic(err)
}
defer resp.Body.Close()
var result CheckResponse
json.NewDecoder(resp.Body).Decode(&result)
for _, e := range result.Errors {
fmt.Printf("%d-%d: '%s' → '%s'\n", e.Start, e.End, e.Wrong, e.Suggestion)
}
// 输出:2-3: '汽' → '气'
}// 调用错别字检测 API(浏览器或 Node.js)
const text = "今天天汽很好,我们去公园玩吧。";
fetch("https://cuobiezi.tl654.com/api/check", {
method: "POST",
headers: { "Content-Type": "application/json" },
body: JSON.stringify({ text })
})
.then(res => res.json())
.then(data => {
data.errors.forEach(err => {
console.log(`${err.start}-${err.end}: '${err.wrong}' → '${err.suggestion}'`);
});
// 输出:2-3: '汽' → '气'
})
.catch(err => console.error("请求失败:", err));7 个高频疑问