我如何创建一个URL缩短?

我想创建一个URL缩短服务，你可以写一个长URL到输入字段和服务缩短URL为“http://www.example.org/abcdef”。

可以用包含a-z, a-z和0-9的6个字符的字符串代替"abcdef"。这样就有560 ~ 570亿个可能的字符串。

我的方法:

我有一个有三列的数据库表:

Id，整数，自动递增 long, string，用户输入的长URL 短，字符串，缩短的URL(或只有六个字符)

然后将长URL插入到表中。然后，我将为“id”选择自动递增的值，并构建它的散列。这个散列应该作为“short”插入。但是我应该构建什么样的哈希呢?像MD5这样的哈希算法会创建太长的字符串。我认为我不用这些算法。一个自建的算法也可以。

我的想法:

对于“http://www.google.de/”，我得到了自动增量id 239472。然后我执行以下步骤:

short = '';
if divisible by 2, add "a"+the result to short
if divisible by 3, add "b"+the result to short
... until I have divisors for a-z and A-Z.

可以不断重复，直到这个数不能被整除为止。你认为这是一个好方法吗?你有更好的主意吗?

由于对这个主题的持续兴趣，我已经发布了一个高效的GitHub解决方案，包括JavaScript、PHP、Python和Java的实现。如果你喜欢，添加你的解决方案:)

当前回答

这是一个不错的PHP URL编码函数…

// From http://snipplr.com/view/22246/base62-encode--decode/
private function base_encode($val, $base=62, $chars='0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ') {
    $str = '';
    do {
        $i = fmod($val, $base);
        $str = $chars[$i] . $str;
        $val = ($val - $i) / $base;
    } while($val > 0);
    return $str;
}

2012-02-13 01:10:44

其他回答

如果你不想重新发明轮子……http://lilurl.sourceforge.net/

2009-04-12 17:12:05

这不是回答你的问题，但我不会使用区分大小写的缩短url。它们很难记住，通常是不可读的(许多字体呈现1和l, 0和O以及其他非常非常相似的字符，它们几乎不可能区分出来)，而且很容易出错。尽量只使用小写或大写。

另外，尝试使用一种预先定义的格式将数字和字符混合在一起。有研究表明，人们往往比其他形式更容易记住一种形式(比如电话号码，这些号码以特定的形式分组)。试试num-char-char-num-char-char。我知道这样会降低组合，尤其是没有大写和小写的情况下，但这样更有用，因此更有用。

2009-04-12 17:50:17

为什么不直接生成一个随机字符串并将其附加到基本URL?这是一个非常简化的c#版本。

static string chars = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890";
static string baseUrl = "https://google.com/";

private static string RandomString(int length)
{
    char[] s = new char[length];
    Random rnd = new Random();
    for (int x = 0; x < length; x++)
    {
        s[x] = chars[rnd.Next(chars.Length)];
    }
    Thread.Sleep(10);

    return new String(s);
}

然后添加一个随机字符串到baseURL:

string tinyURL = baseUrl + RandomString(5);

记住，这是一个非常简化的版本，RandomString方法可能会创建重复的字符串。在生产中，您需要考虑重复的字符串，以确保始终拥有唯一的URL。我有一些代码，通过查询我可以共享的数据库表来考虑重复的字符串，如果任何人感兴趣的话。

2019-11-14 18:05:14

这是我最初的想法，可以做更多的思考，或者做一些模拟，看看是否有效或需要改进:

我的答案是记住数据库中的长URL，并使用ID 0到999999999999999999(或所需的任意大的数字)。

但是ID 0到999999999999999999可能是个问题，因为

如果我们使用十六进制，甚至base62或base64，它可以更短。(base64就像YouTube使用A-Z A-Z 0-9 _和-) 如果它从0均匀地增加到999999999999999999，那么黑客就可以按照这个顺序访问它们，并知道人们相互发送的url，所以这可能是一个隐私问题

我们可以这样做:

have one server allocate 0 to 999 to one server, Server A, so now Server A has 1000 of such IDs. So if there are 20 or 200 servers constantly wanting new IDs, it doesn't have to keep asking for each new ID, but rather asking once for 1000 IDs for the ID 1, for example, reverse the bits. So 000...00000001 becomes 10000...000, so that when converted to base64, it will be non-uniformly increasing IDs each time. use XOR to flip the bits for the final IDs. For example, XOR with 0xD5AA96...2373 (like a secret key), and the some bits will be flipped. (whenever the secret key has the 1 bit on, it will flip the bit of the ID). This will make the IDs even harder to guess and appear more random

按照这种方案，分配id的单个服务器可以组成id，请求分配id的20或200个服务器也可以组成id。分配服务器必须使用锁/信号量来防止两个请求服务器获得相同的批处理(或者如果它一次接受一个连接，这已经解决了问题)。因此，我们不希望等待分配的队列太长。所以这就是为什么一次分配1000或10000个可以解决问题。

2019-12-10 08:27:08

我的方法是:获取数据库ID，然后对其进行Base36编码。我不会同时使用大写字母和小写字母，因为这会使通过电话传输这些url成为一场噩梦，但您当然可以轻松地将该功能扩展为62 en/解码器。

2009-04-14 08:02:13

我如何创建一个URL缩短?

推荐文章

最新文章

标签