有个问题我始终没有弄明白,如 claude 这样的模型,中国大陆 IP 不能访问
那他为啥对中文支持还挺好,而且中文的回答并不比国内模型差呢?既然不让中国人用(甚至港澳 IP 也用不了),为何搞简体中文版本?
难道是为了海外华人特别是还用简中的人使用的吗? 那才有多少人啊,数量级也就百八十万吧。
还是说这 AI ,在训练或推理时,对于多一种语言支持,其实并不费什么事儿?
还有就是到底是中国想用而不得,还是 GFW 也墙了 claude ,这个有懂的吗 google 的大部分业务中国大陆也用不了,为什么还要做简体中文的本地化呢? 用中文预料训练啊 1.境外华人华侨,使用中文,并且使用简中的比重在逐渐增大;
2.境内,用中转站喂养大模型的中文能力;
3.没法用是双向奔赴,对面既不想给中国用,中国也不想让这个东西因为不受控而在国内用途广泛,参考 Google 。 大模型的训练资料包括整个互联网,理所当然包括各种语言的互联网资料,没必要特别去排除吧。 因为需求的人少就不用理会,这种思想是很可怕的,或许这也是国内软件无障碍如此糟糕的原因之一吧。 你这是小看海外华人数量了
你可以问问 claude 海外有多少人使用简体中文 感觉楼主就是揣着明白装糊涂,这种帖子都月经了 两个冷知识:
1. 「简体中文」不仅仅在我国被广泛使用。
2. 「简体中文」/「简化字」不是你裆的创造发明。 中国不能用是政策问题,模型支持中文语料是技术问题。 哪天政策变了,重头训练模型?
页:
[1]
2