首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据库相关

    MySQL的字符集和字符编码笔记

    深入的请参考卢sir的博客: http://cenalulu.github.io/linux/character-encoding/ http://cenalulu.github.io/mysql/mysql-mojibake

    2K30发布于 2019-09-18
  • 来自专栏浊酒清味

    那些被低估的Python库

    3 数据清理和操作 ftfy:修复mojibake和Unicode文本中的其他故障。 janitor:有很多很酷的功能来清理数据。 Optimus:另一个数据清理包。

    1.1K20发布于 2020-07-27
  • 来自专栏用户2910674的专栏

    7 个令人惊叹的 Python 库

    这被称为:Mojibake术语用于描述编码或解码问题而发生的乱码或乱码文本。 当使用一种字符编码编写的文本使用不同的编码错误解码时,通常会发生这种情况。 ftfy python库将帮助您修复Mojibake,这在NLP用例中非常有用。 ftfy.fix_text('✔ No problems with text')) print(ftfy.fix_text('à perturber la réflexion')) 输出 除了Mojibake

    1.8K31编辑于 2023-10-24
  • 来自专栏萝卜大杂烩

    7 个令人惊叹的 Python 库

    这被称为:Mojibake术语用于描述编码或解码问题而发生的乱码或乱码文本。 当使用一种字符编码编写的文本使用不同的编码错误解码时,通常会发生这种情况。 ftfy python库将帮助您修复Mojibake,这在NLP用例中非常有用。 ftfy.fix_text('✔ No problems with text')) print(ftfy.fix_text('à perturber la réflexion')) 输出 除了Mojibake

    1.9K10编辑于 2023-09-22
  • 来自专栏程序员成长充电站

    为什么计算机会出现乱码—二进制(二)

    Unicode 日本人总是碰到编码问题,以至于专门有词来称呼:"mojibake" 意思是 乱码,所以 Unicode 诞生了 - 统一所有编码的标准设计于 1992 年,解决了不同国家不同标准的问题,

    1.1K20发布于 2019-08-19
  • 来自专栏北京马哥教育

    Python字符编码全解析

    虽然各个国家和地区可以制定自己的编码方案,但不同国家和地区的计算机在数据传输的过程中就会出现各种各样的乱码(mojibake),这无疑是个灾难。 怎么办?

    1.7K60发布于 2018-05-04
  • 来自专栏苦逼的码农

    从本质上搞懂头痛的乱码问题!

    (PS:这里科普下 乱码的英文native说法是 mojibake)。于是为了实现转换标准,各种字符集标准就出现了。

    1K10发布于 2019-12-05
  • TypeScript + React + GitHub Actions:我是如何打造全自动化 AI 资讯系统的 - 已开源

    buffer);//选择损坏字符更少的版本if(countGarbledChars(gb18030Html)<countGarbledChars(html)){html=gb18030Html;}}还有Mojibake

    16610编辑于 2026-03-24
  • 来自专栏即时通讯技术

    史上最通俗,彻底搞懂字符乱码问题的本质

    9、为什么会出现乱码 乱码也就是英文常说的mojibake(由日语的文字化け音译)。 简单的说乱码的出现是因为:编码和解码时用了不同或者不兼容的字符集。

    3.6K10发布于 2019-12-20
  • 来自专栏后台开发随笔

    MySQL 编码和解码

    参考文章 http://blog.jobbole.com/84903/ http://cenalulu.github.io/mysql/mysql-mojibake/ https://www.cnblogs.com

    6.5K20发布于 2018-12-07
  • 来自专栏信数据得永生

    流畅的 Python 第二版(GPT 重译)(二)

    提示 乱码字符被称为 gremlins 或 mojibake(文字化け—日语中的“转换文本”)。

    1.2K00编辑于 2024-05-24
领券