用Emscripten编译wasm版本的 OpenCC,在浏览器上进行简繁体转换



  • OpenCC 很好,但遗憾的是我们必须开个服务才能使用。而我先前一直希望能在浏览器上直接运行,对页面的文本直接进行转换。

    而后发现tesseract.js是使用 Emscripten 编译而成,对 wasm 相关技术的成熟度感到意外。于是便有了编译wasm版本的OpenCC的想法,同时也是对Emscripten进行一番探索。

    这个项目对 OpenCC 进行了添加修改修改,并利用Emscripten进行编译,在 OpenCC 进行中文简繁体转换的能力上具有以下特性:

    可在浏览器环境中直接运行。
    在 node,eletron 中运行不需要再进行 addon 编译,避免复杂的 addon 部署工作。理论上应该也可以在 React Native 和 Web Worker 中运行(未经测试)。
    分离了字典数据的加载和文本转换功能,在浏览器中只加载必要的字典数据,并允许自定义数据加载方式,方便从 CDN 上加载数据。

    Read the full article: https://medium.com/@oyyd/用emscripten编译wasm版本的-opencc-在浏览器上进行简繁体转换-8ddeb8e0877d


 

A community for developers looking to put WebAssembly to use today. Come rock WebAssembly with us!