Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

想整合小鹤音形,有什么好的实现方法? #515

Open
king-ta opened this issue Oct 14, 2023 · 37 comments
Open

想整合小鹤音形,有什么好的实现方法? #515

king-ta opened this issue Oct 14, 2023 · 37 comments

Comments

@king-ta
Copy link

king-ta commented Oct 14, 2023

全放在自定义短语用了一段时间后发现,部分词无法自造词。
整合到词库里,怎么也无法实现我想要的效果——所有音形码字词字词固定最前面。(优先级最高)
image

目前词库是生效了,有好办法可以简单的提升码表优先级吗?

谢谢!


已通过 pin_cand_filter.lua 置顶候选项 #586
将所以2码单字编辑到 pin_cand_filter 里就不影响造词了。

@iDvel v5🥳

@iDvel
Copy link
Owner

iDvel commented Oct 14, 2023

在同一个翻译器内,让某词库文件保持高或低优先级,似乎不行。
在不同的翻译器可以,但无法造词。
好像无解,我也想要。

@avalonzz
Copy link

想要个自然码辅码,看了GitHub的一些应用,还是放弃了。

@sfzylx
Copy link

sfzylx commented Oct 30, 2023

在同一个翻译器内,让某词库文件保持高或低优先级,似乎不行。 在不同的翻译器可以,但无法造词。 好像无解,我也想要。

我就是用了两个翻译器,一个是带辅助码的自然码(这个作为主解释器),一个是单纯的自然码双拼(用lua作为解释器)。当选择单字时屏蔽自然码双拼解释器,只是用带有辅助码的解释器,相当于只用主解释器造词。使用起来还可以。
主要是没有更好的选择。
相关lua代码如下:

-- lua/top_translator.lua
local top = {}


function top.init(env)
   -- 创建 translator 组件,供后续调用
   env.fixed = Component.Translator(env.engine, "", "script_translator@ice")
 end

function top.fini(env)
end

function top.func(input, seg, env)
   --local smart_res = env.smart:query(input, seg)
   local fixed_res = env.fixed:query(input, seg)
   if (env.engine.context.input == input) and fixed_res ~= nil then
      for cand in fixed_res:iter() do
         yield(cand)   
      end
   end
      
end

return top

本人不太会写代码,上述代码是从 这里 抄过来。

@lclrc
Copy link

lclrc commented Nov 5, 2023

流星追月 试试这个,记得把全拼去掉

@ernsky
Copy link

ernsky commented Nov 5, 2023

原来有成品

@avalonzz
Copy link

刚刚看到这个,独立的文件来存储辅码,不用生成音形混合的词典。 @iDvel 大佬给看看有没有可能整合? 感谢https://github.com/HowcanoeWang/rime-lua-aux-code

@iDvel
Copy link
Owner

iDvel commented Nov 19, 2023

这个仓库不加形了,有需要可以自己加一下。

@AiraNadih
Copy link

AiraNadih commented Nov 19, 2023

刚刚看到这个,独立的文件来存储辅码,不用生成音形混合的词典。 @iDvel 大佬给看看有没有可能整合? 感谢https://github.com/HowcanoeWang/rime-lua-aux-code

我已经通过这个项目的 lua 脚本为 double_pinyin_flypy.schema.yaml 挂载了小鹤音形码:HowcanoeWang/rime-lua-aux-code#4

不过实际用下来发现,这音形码数量差得也太多了。 😂
明明是从小鹤音形官网下载的音形码,居然也不够完善。

@avalonzz
Copy link

刚刚看到这个,独立的文件来存储辅码,不用生成音形混合的词典。 @iDvel 大佬给看看有没有可能整合? 感谢https://github.com/HowcanoeWang/rime-lua-aux-code

我已经通过这个项目的 lua 脚本为 double_pinyin_flypy.schema.yaml 挂载了小鹤音形码:HowcanoeWang/rime-lua-aux-code#4

不过实际用下来发现,这音形码数量差得也太多了。 😂 明明是从小鹤音形官网下载的音形码,居然也不够完善。

不太懂代码,还只是初步挂了,rime能输如单字,但上屏后;还会挂在输入框里。摸索中。

@AiraNadih
Copy link

AiraNadih commented Nov 20, 2023

不太懂代码,还只是初步挂了,rime能输如单字,但上屏后;还会挂在输入框里。摸索中。

其实我也不是很了解具体的细节,我测试发现:

test

@HowcanoeWang 是我的用法不对?还是代码逻辑问题?😂

随便,我发现有更全的码表,打算等这个问题解决了再加上。

@HowcanoeWang
Copy link

HowcanoeWang commented Nov 20, 2023

不太懂代码,还只是初步挂了,rime能输如单字,但上屏后;还会挂在输入框里。摸索中。

其实我也不是很了解具体的细节,我测试发现:

test

@HowcanoeWang 是我的用法不对?还是代码逻辑问题?😂

随便,我发现有更全的码表,打算等这个问题解决了再加上。

现在手头没有测试的工具,需要等到月底才行

这个问题出现在你修改了代码逻辑那个pr之后还是之前?

建议查看一下输入法配置中,上屏;是否为英文半角,如果是全角符号有可能代码逻辑里无法去除

参考你那个动图,第二行那个没有全角提示看起来是正常的表现

@AiraNadih
Copy link

AiraNadih commented Nov 21, 2023

现在手头没有测试的工具,需要等到月底才行

这个问题出现在你修改了代码逻辑那个pr之后还是之前?

建议查看一下输入法配置中,上屏;是否为英文半角,如果是全角符号有可能代码逻辑里无法去除

参考你那个动图,第二行那个没有全角提示看起来是正常的表现

问题在 PR 之前就存在。动图演示了三种情况:

  1. 输入整个词,然后输入第一个字的形码,最后按下空格,会有全角分号提示。
  2. 输入整个词,然后输入第一个字的形码,然后按 2 选择第一个字,连续按下空格两次,没有全角分号提示。
  3. 输入单个字,输入形码后按下空格,会有全角分号提示。

注意:动图中使用的是PR后的代码,"过滤辅助码"部分逻辑有错误,但与分号无关。原始代码也经过测试,同样会显示全角分号。

我再次查看了 README.md ,这是否原本就是设计为动图演示的第二种情况的用法?感觉这样的实现有点局限。
另外, README.md 提到的 "支持词语级筛选(非首字筛选)" 无法成功使用。

@boomker
Copy link
Contributor

boomker commented Nov 21, 2023

小鹤挂接形码的方案,可以试试我的 飞鹤快拼方案

@HowcanoeWang
Copy link

现在手头没有测试的工具,需要等到月底才行

这个问题出现在你修改了代码逻辑那个pr之后还是之前?

建议查看一下输入法配置中,上屏;是否为英文半角,如果是全角符号有可能代码逻辑里无法去除

参考你那个动图,第二行那个没有全角提示看起来是正常的表现

问题在 PR 之前就存在。动图演示了三种情况:

  1. 输入整个词,然后输入第一个字的形码,最后按下空格,会有全角分号提示。
  2. 输入整个词,然后输入第一个字的形码,然后按 2 选择第一个字,连续按下空格两次,没有全角分号提示。
  3. 输入单个字,输入形码后按下空格,会有全角分号提示。

注意:动图中使用的是PR后的代码,"过滤辅助码"部分逻辑有错误,但与分号无关。原始代码也经过测试,同样会显示全角分号。

我再次查看了 README.md ,这是否原本就是设计为动图演示的第二种情况的用法?感觉这样的实现有点局限。
另外, README.md 提到的 "支持词语级筛选(非首字筛选)" 无法成功使用。

并不是我原本的设计方案,在我原本的处理逻辑里,如果仅剩一个分号(值=;且长度为1),就会直接删除待选直接把候选上屏,不需要按两次空格。且我自己的方案里并没有出现这个分号问题。

不确定是不是这个ice输入法的某些配置造成了影响,手头暂时没测试环境,如果方便的话,帮我测试一下,使用原本的rime默认双拼输入法看看会不会有同样的效果?

@AiraNadih
Copy link

AiraNadih commented Nov 22, 2023

并不是我原本的设计方案,在我原本的处理逻辑里,如果仅剩一个分号(值=;且长度为1),就会直接删除待选直接把候选上屏,不需要按两次空格。且我自己的方案里并没有出现这个分号问题。

不确定是不是这个ice输入法的某些配置造成了影响,手头暂时没测试环境,如果方便的话,帮我测试一下,使用原本的rime默认双拼输入法看看会不会有同样的效果?

感觉原先的判断 reeditTextFront 的逻辑不完备,所以才导致多了分号。
我目前大概是修好了,在那个 PR 里更新了下。

另外 "支持词语级筛选(非首字筛选)" 这个功能被 commit fd7bbe2 破坏了。我暂时回滚部分代码至之前的版本并优化,以便重新启用此功能。

@avalonzz 欢迎你再尝试下。

@avalonzz
Copy link

并不是我原本的设计方案,在我原本的处理逻辑里,如果仅剩一个分号(值=;且长度为1),就会直接删除待选直接把候选上屏,不需要按两次空格。且我自己的方案里并没有出现这个分号问题。
不确定是不是这个ice输入法的某些配置造成了影响,手头暂时没测试环境,如果方便的话,帮我测试一下,使用原本的rime默认双拼输入法看看会不会有同样的效果?

感觉原先的判断 reeditTextFront 的逻辑不完备,所以才导致多了分号。 我目前大概是修好了,在那个 PR 里更新了下。

另外 "支持词语级筛选(非首字筛选)" 这个功能被 commit fd7bbe2 破坏了。我暂时回滚部分代码至之前的版本并优化,以便重新启用此功能。

@avalonzz 欢迎你再尝试下。

谢谢 @AiraNadih 的努力,我这边也可以正常上屏了。

@lovelock
Copy link

lovelock commented Jan 9, 2024

看我这个,已经用了半年了,非常舒服。基于流星追月的translator和rime-ice实现的。 https://github.com/lovelock/rime-ice。
这个方案不支持修改词频,其实是继承了形码的特点,如果要实现盲打,最好还是固定词频。

@lovelock
Copy link

lovelock commented Jan 9, 2024

小鹤挂接形码的方案,可以试试我的 飞鹤快拼方案

你这个readme看起来应该是从fastzrm fork过来的,他自己实现的方案我用过,很多形码和官方的不一样,有些字打不出来。

@boomker
Copy link
Contributor

boomker commented Jan 10, 2024

小鹤挂接形码的方案,可以试试我的 飞鹤快拼方案

你这个readme看起来应该是从fastzrm fork过来的,他自己实现的方案我用过,很多形码和官方的不一样,有些字打不出来。


我的方案里,添加了一些fastzrm中没有的字,你可以试试,有缺字的,提个 issue联系我。
常用的字应该都在的,不常用的字可能没收集

@gaboolic
Copy link
Contributor

gaboolic commented Mar 4, 2024

我整了一个
https://github.com/gaboolic/rime-shuangpin-fuzhuma
现在其中有墨奇音形,小鹤的鹤形,自然码部首3种

@gaboolic
Copy link
Contributor

gaboolic commented Mar 4, 2024

image

@gaboolic
Copy link
Contributor

gaboolic commented Mar 4, 2024

想要个自然码辅码,看了GitHub的一些应用,还是放弃了。

https://github.com/ksqsf/rime-moran
这个方案不错。我也参考了其中一些

@kchen0x
Copy link

kchen0x commented May 10, 2024

@chca2
Copy link

chca2 commented May 12, 2024

给楼上的淞鹤顶一下,很好用。

@KeithW0726
Copy link

都快花眼了。
作为了一个小白,我主力使用雾凇词库,只想知道,在能持续使用雾凇方案的前提下,该怎样用上面这些大佬的小鹤音形rime方案呢?

@kchen0x
Copy link

kchen0x commented Jul 11, 2024

都快花眼了。 作为了一个小白,我主力使用雾凇词库,只想知道,在能持续使用雾凇方案的前提下,该怎样用上面这些大佬的小鹤音形rime方案呢?

「凇鹤」不就是持续使用「雾凇」和「小鹤音形」的方案吗,我会定期更新最新的「雾凇」和「小鹤音形」变动到「凇鹤」里面的。

@king-ta

This comment was marked as duplicate.

@gaboolic
Copy link
Contributor

都快花眼了。 作为了一个小白,我主力使用雾凇词库,只想知道,在能持续使用雾凇方案的前提下,该怎样用上面这些大佬的小鹤音形rime方案呢?

上面应该都是基于雾凇词库的双拼加形。
不过我的方案 墨奇音形 现在词库独立演进了,用大量高质量语料重调了词频

@netvolcano
Copy link

netvolcano commented Jul 12, 2024 via email

@KeithW0726
Copy link

KeithW0726 commented Jul 12, 2024

我这估计讲我的背景也太简单了。

我简单说说,算是给各位大佬们一个人物画像作为参考

  1. 我能够改配置文件,基本能看懂配置文件啥,太深奥的就不咋懂了。
  2. 我现在主力使用雾凇拼音词库,也借此积累了自己大量的使用过的词库。
  3. 方案使用的是小鹤双拼+部分全拼,方案也完全是使用雾凇拼音啥的,所以对我来说,雾凇拼音词库一更新,我只要git pull,然后复制覆盖粘贴进行,个别我有一些个人custom配置。
  4. 看各位大佬都有维护独立更新词库啥的,如果大幅度调整,对我来说迁移成本和调教成本就会非常之高。当然对于从零开始来说就没这个问题

基于以上,我是用过,且有积累的,所以如何迁移才能最大化保留我之前的使用习惯是我会考虑的。
我看各位大佬都列出各种各样的解决办法,但我看得眼花缭乱,就是不知道在保持使用雾凇拼音的前提下,我该拆出哪些词库+输入法方案文件整合我才能用上小鹤形码啥的。。。。

  1. 我确定的是独立演进词库的这种就pass掉,迁移成本太高,折腾意义不大,当前雾凇词库啥的是能满足的。
  2. 如果用凇鹤的话,我该怎样保留哪些,迁移改动哪些呢?

@gaboolic
Copy link
Contributor

我觉得目前这些方案说明文档都写得太简略了,都默认了大家是使用RIME的专家,看了后都不知道该如何来安装或配置。最好有一些非常初步的安装或配置说明,基于:1、用户完全不知道RIME的配置原理;2、如何让用户保留自己以前积累的词库,方便进行迁移。没有这些使用指导,基本上来follow的人就没有,只能是作者自High。 Sender: gaboolic Send Time: 2024-07-11 23:38 Receiver: iDvel/rime-ice cc: Subscribed Subject: Re: [iDvel/rime-ice] 想整合小鹤音形,有什么好的实现方法? (Issue #515) 都快花眼了。 作为了一个小白,我主力使用雾凇词库,只想知道,在能持续使用雾凇方案的前提下,该怎样用上面这些大佬的小鹤音形rime方案呢? 上面应该都是基于雾凇词库的双拼加形。 不过我的方案 墨奇音形 现在词库独立演进了,用大量高质量语料重调了词频 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>


正常的,你都用rime了,还会用github,那在我看来你肯定不是一个普通的小白用户,多少会一点。稍微看下rime官方文档和其他方案也就会了。
我刚用rime也是什么都不会,用着用着就都会了。
“来follow的人就没有”,也不至于,我的方案开源出来 几个月就200多star了

@kchen0x
Copy link

kchen0x commented Jul 12, 2024

我这估计讲我的背景也太简单了。

我简单说说,算是给各位大佬们一个人物画像作为参考

  1. 我能够改配置文件,基本能看懂配置文件啥,太深奥的就不咋懂了。
  2. 我现在主力使用雾凇拼音词库,也借此积累了自己大量的使用过的词库。
  3. 方案使用的是小鹤双拼+部分全拼,方案也完全是使用雾凇拼音啥的,所以对我来说,雾凇拼音词库一更新,我只要git pull,然后复制覆盖粘贴进行,个别我有一些个人custom配置。
  4. 看各位大佬都有维护独立更新词库啥的,如果大幅度调整,对我来说迁移成本和调教成本就会非常之高。当然对于从零开始来说就没这个问题

基于以上,我是用过,且有积累的,所以如何迁移才能最大化保留我之前的使用习惯是我会考虑的。 我看各位大佬都列出各种各样的解决办法,但我看得眼花缭乱,就是不知道在保持使用雾凇拼音的前提下,我该拆出哪些词库+输入法方案文件整合我才能用上小鹤形码啥的。。。。

  1. 我确定的是独立演进词库的这种就pass掉,迁移成本太高,折腾意义不大,当前雾凇词库啥的是能满足的。
  2. 如果用凇鹤的话,我该怎样保留哪些,迁移改动哪些呢?

我没有自行演进词库(没有必要,也没有精力):

  1. 拼音+双拼部分我保持的雾凇的原版词库,定期更新;
  2. 音形部分我保持的鹤大的原版码表,定期更新;

所以如果你要切换的话,直接使用 rime-crane 的仓库,然后把你现在的雾凇的的 rime_ice.userdb 文件夹拷贝进去就行了。
如果你有其他自定义的改动,也一并拷贝进去。

@gaboolic
Copy link
Contributor

我这估计讲我的背景也太简单了。

我简单说说,算是给各位大佬们一个人物画像作为参考

  1. 我能够改配置文件,基本能看懂配置文件啥,太深奥的就不咋懂了。
  2. 我现在主力使用雾凇拼音词库,也借此积累了自己大量的使用过的词库。
  3. 方案使用的是小鹤双拼+部分全拼,方案也完全是使用雾凇拼音啥的,所以对我来说,雾凇拼音词库一更新,我只要git pull,然后复制覆盖粘贴进行,个别我有一些个人custom配置。
  4. 看各位大佬都有维护独立更新词库啥的,如果大幅度调整,对我来说迁移成本和调教成本就会非常之高。当然对于从零开始来说就没这个问题

基于以上,我是用过,且有积累的,所以如何迁移才能最大化保留我之前的使用习惯是我会考虑的。 我看各位大佬都列出各种各样的解决办法,但我看得眼花缭乱,就是不知道在保持使用雾凇拼音的前提下,我该拆出哪些词库+输入法方案文件整合我才能用上小鹤形码啥的。。。。

  1. 我确定的是独立演进词库的这种就pass掉,迁移成本太高,折腾意义不大,当前雾凇词库啥的是能满足的。
  2. 如果用凇鹤的话,我该怎样保留哪些,迁移改动哪些呢?

你用雾凇词库打一下白霜拼音 这里的几个句子 就知道为什么要独立演进了。另外,也不会造成迁移成本太高,白霜拼音 我只改了词库部分 别的都没动。

@KeithW0726
Copy link

KeithW0726 commented Jul 12, 2024

我这估计讲我的背景也太简单了。
我简单说说,算是给各位大佬们一个人物画像作为参考

  1. 我能够改配置文件,基本能看懂配置文件啥,太深奥的就不咋懂了。
  2. 我现在主力使用雾凇拼音词库,也借此积累了自己大量的使用过的词库。
  3. 方案使用的是小鹤双拼+部分全拼,方案也完全是使用雾凇拼音啥的,所以对我来说,雾凇拼音词库一更新,我只要git pull,然后复制覆盖粘贴进行,个别我有一些个人custom配置。
  4. 看各位大佬都有维护独立更新词库啥的,如果大幅度调整,对我来说迁移成本和调教成本就会非常之高。当然对于从零开始来说就没这个问题

基于以上,我是用过,且有积累的,所以如何迁移才能最大化保留我之前的使用习惯是我会考虑的。 我看各位大佬都列出各种各样的解决办法,但我看得眼花缭乱,就是不知道在保持使用雾凇拼音的前提下,我该拆出哪些词库+输入法方案文件整合我才能用上小鹤形码啥的。。。。

  1. 我确定的是独立演进词库的这种就pass掉,迁移成本太高,折腾意义不大,当前雾凇词库啥的是能满足的。
  2. 如果用凇鹤的话,我该怎样保留哪些,迁移改动哪些呢?

我没有自行演进词库(没有必要,也没有精力):

1. 拼音+双拼部分我保持的雾凇的原版词库,定期更新;

2. 音形部分我保持的鹤大的原版码表,定期更新;

所以如果你要切换的话,直接使用 rime-crane 的仓库,然后把你现在的雾凇的的 rime_ice.userdb 文件夹拷贝进去就行了。 如果你有其他自定义的改动,也一并拷贝进去。

感谢大佬的介绍。
因为毕竟不是老手,我打算从兼容度最好的凇鹤拼音入手。
特此记录如下,也是给后来的新手一个参考:

  1. 我个人亲自验证了下,凇鹤拼音的仓库,在原来的雾凇拼音仓库没有变动太多,只精简了其他不必要的双拼方案文件。关键词词库什么都没变
  2. 变动部分主要有以下:
    xhup.scheme方案,对应的万能反引号反查scheme方案,以及对应的一系列的码表文件夹 /xhup_dicts/*
    default文件不必说,需要调整scheme list的需要,最好是在自己的default.custom 手动改,方便后面的更新维护。
    对应的lua文件夹,新增的/lua/xhup/*
    openCC 文件夹:opencc/short_*

核心变动思路就是:双拼保持雾淞,再挂载小鹤音形的方案,对应的码表单独维护,周边功能通过OpenCC和lua来处理。
综合这些文件和内容的变化,心中大概就有谱了。
不放心的,就只把对应的变化文件手动放进去。
放心的,就像大佬说的,把自己使用的雾凇词库积累的个人的custom文件,rime_ice移过去就行(前提是我使用雾凇方案是完全使用,自定义就通过custom,这样的使用方式对迁移是非常良好的),之后跟着大佬的文件更新词库和方案就行。

得益于大佬的方案架构,迁移非常顺利。
后面就是随着使用,再慢慢调教。

@KeithW0726
Copy link

KeithW0726 commented Jul 24, 2024

时隔两周,再次在这里求助有没有比较好在雾凇方案基础上整合虎码单字+词形码的方案?

原因是跟着凇鹤的虎码方案使用,感觉作者被我大量的issue折磨惨了(在这给凇鹤作者抱个歉),作者估计日常工作繁忙,无暇顾及我这,但有些细节确实我也琢磨不清楚,想自己改提PR都无从下手,只能再次在这求助看看有没有其他整合虎码方案的,感谢!

@gaboolic
Copy link
Contributor

gaboolic commented Jul 24, 2024

时隔两周,再次在这里求助有没有比较好在雾凇方案基础上整合虎码单字+词形码的方案?

原因是跟着凇鹤的虎码方案使用,感觉作者被我大量的issue折磨惨了(在这给凇鹤作者抱个歉),作者估计日常工作繁忙,无暇顾及我这,但有些细节确实我也琢磨不清楚,想自己改提PR都无从下手,只能再次在这求助看看有没有其他整合虎码方案的,感谢!

https://github.com/gaboolic/rime-shuangpin-fuzhuma/wiki/%E9%9B%BE%E5%87%87%E8%AF%8D%E5%BA%93%E8%BD%AC%E4%B8%BA%E5%8F%8C%E6%8B%BC%E8%BE%85%E5%8A%A9%E7%A0%81%E8%AF%8D%E5%BA%93%E7%9A%84%E6%96%B9%E6%B3%95

我有脚本,想用啥辅助码都行。如果你能看懂,改下读取的辅助码文件就行了。比如小鹤+仓颉,自然码+五笔,都行。
未来打算换一种方式 支持任意双拼+任意辅助码

@gaboolic
Copy link
Contributor

gaboolic commented Aug 27, 2024

时隔两周,再次在这里求助有没有比较好在雾凇方案基础上整合虎码单字+词形码的方案?

原因是跟着凇鹤的虎码方案使用,感觉作者被我大量的issue折磨惨了(在这给凇鹤作者抱个歉),作者估计日常工作繁忙,无暇顾及我这,但有些细节确实我也琢磨不清楚,想自己改提PR都无从下手,只能再次在这求助看看有没有其他整合虎码方案的,感谢!

墨奇音形现在加了万象词库版,通过拼写运算可以支持任意双拼任意辅助码了。可以直接用小鹤双拼+虎码首末形

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests