我如何创建一个URL缩短?

我想创建一个URL缩短服务，你可以写一个长URL到输入字段和服务缩短URL为“http://www.example.org/abcdef”。

可以用包含a-z, a-z和0-9的6个字符的字符串代替"abcdef"。这样就有560 ~ 570亿个可能的字符串。

我的方法:

我有一个有三列的数据库表:

Id，整数，自动递增 long, string，用户输入的长URL 短，字符串，缩短的URL(或只有六个字符)

然后将长URL插入到表中。然后，我将为“id”选择自动递增的值，并构建它的散列。这个散列应该作为“short”插入。但是我应该构建什么样的哈希呢?像MD5这样的哈希算法会创建太长的字符串。我认为我不用这些算法。一个自建的算法也可以。

我的想法:

对于“http://www.google.de/”，我得到了自动增量id 239472。然后我执行以下步骤:

short = '';
if divisible by 2, add "a"+the result to short
if divisible by 3, add "b"+the result to short
... until I have divisors for a-z and A-Z.

可以不断重复，直到这个数不能被整除为止。你认为这是一个好方法吗?你有更好的主意吗?

由于对这个主题的持续兴趣，我已经发布了一个高效的GitHub解决方案，包括JavaScript、PHP、Python和Java的实现。如果你喜欢，添加你的解决方案:)

当前回答

我有一个问题的变体，因为我存储了来自许多不同作者的网页，需要防止通过猜测发现页面。所以我的短url在Base-62字符串中添加了几个额外的数字作为页码。这些额外的数字是由页面记录本身的信息生成的，它们确保3844个url中只有一个是有效的(假设2位Base-62)。您可以在http://mgscan.com/MBWL上看到概要描述。

2015-03-15 09:42:53

其他回答

您可以散列整个URL，但如果您只想缩短id，请按照marcel的建议进行。我写了这个Python实现:

https://gist.github.com/778542

2011-01-17 21:35:46

看看https://hashids.org/，它是开源的，有多种语言版本。

他们的页面概述了其他方法的一些陷阱。

2020-03-17 11:32:46

这不是回答你的问题，但我不会使用区分大小写的缩短url。它们很难记住，通常是不可读的(许多字体呈现1和l, 0和O以及其他非常非常相似的字符，它们几乎不可能区分出来)，而且很容易出错。尽量只使用小写或大写。

另外，尝试使用一种预先定义的格式将数字和字符混合在一起。有研究表明，人们往往比其他形式更容易记住一种形式(比如电话号码，这些号码以特定的形式分组)。试试num-char-char-num-char-char。我知道这样会降低组合，尤其是没有大写和小写的情况下，但这样更有用，因此更有用。

2009-04-12 17:50:17

为什么不直接生成一个随机字符串并将其附加到基本URL?这是一个非常简化的c#版本。

static string chars = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890";
static string baseUrl = "https://google.com/";

private static string RandomString(int length)
{
    char[] s = new char[length];
    Random rnd = new Random();
    for (int x = 0; x < length; x++)
    {
        s[x] = chars[rnd.Next(chars.Length)];
    }
    Thread.Sleep(10);

    return new String(s);
}

然后添加一个随机字符串到baseURL:

string tinyURL = baseUrl + RandomString(5);

记住，这是一个非常简化的版本，RandomString方法可能会创建重复的字符串。在生产中，您需要考虑重复的字符串，以确保始终拥有唯一的URL。我有一些代码，通过查询我可以共享的数据库表来考虑重复的字符串，如果任何人感兴趣的话。

2019-11-14 18:05:14

我将继续您的“将数字转换为字符串”方法。但是，如果您的ID是质数且大于52，您将意识到您提出的算法将失败。

理论背景

你需要一个双射函数f。这是必要的，这样你就可以为你的f(123) = 'abc'函数找到一个逆函数g('abc') = 123。这意味着:

一定不存在x1 x2 (x1≠x2)使得f(x1) = f(x2) 对于每一个y，你必须能找到一个x，使f(x) = y。

如何将ID转换为缩短的URL

Think of an alphabet we want to use. In your case, that's [a-zA-Z0-9]. It contains 62 letters. Take an auto-generated, unique numerical key (the auto-incremented id of a MySQL table for example). For this example, I will use 12510 (125 with a base of 10). Now you have to convert 12510 to X62 (base 62). 12510 = 2×621 + 1×620 = [2,1] This requires the use of integer division and modulo. A pseudo-code example: digits = [] while num > 0 remainder = modulo(num, 62) digits.push(remainder) num = divide(num, 62) digits = digits.reverse Now map the indices 2 and 1 to your alphabet. This is how your mapping (with an array for example) could look like: 0 → a 1 → b ... 25 → z ... 52 → 0 61 → 9 With 2 → c and 1 → b, you will receive cb62 as the shortened URL. http://shor.ty/cb

如何将缩短的URL解析为初始ID

反过来就更容易了。你只需要在字母表中反向查找。

E9a62将被解析为“字母表中的第4、61和0个字母”。 E9a62 = [4,61,0] = 4×622 + 61×621 + 0×620 = 1915810 现在找到WHERE id = 19158的数据库记录并执行重定向。

示例实现(由评论者提供)

c++ Python Ruby Haskell c# CoffeeScript Perl

2009-04-12 16:50:21

我如何创建一个URL缩短?

推荐文章

最新文章

标签