避免在“短URL”中使用真正的英语单词,而不会牺牲太多的空间

假设这里使用的语言是英语,并且使用的字符集是基本的ASCII /拉丁字母.

在生成“短网址”时,首先要考虑的是使用大型“代码集”/字母表将整数(可能是引用数据库中长网址的ID)转换为高“基数”(URL友好的基础)例如,64).在我的具体情况下,我首先选择标准化为Base-36(数字,拉丁字母,不区分大小写).

然而,仔细观察后,人们可能会发现他们的短网址生成器最终会吐出顽皮的单词或其他常见的单词,这可能是非常不受欢迎的.

避免生成“真实单词”的一个选择是仅删除所有常见元音.

是否有其他/更好的解决方法不会牺牲太多的空间?

最佳答案 我认为剥离元音的想法将是你最好的.

其他任何东西,如黑名单,字典查找等,都将非常繁琐,需要大量维护,并最终可以实现.

点赞