我有以下代码来做到这一点,但我如何能做得更好?现在我认为它比嵌套循环更好,但是当您在列表理解中使用生成器时,它开始变得像perl一行程序。
day_count = (end_date - start_date).days + 1
for single_date in [d for d in (start_date + timedelta(n) for n in range(day_count)) if d <= end_date]:
print strftime("%Y-%m-%d", single_date.timetuple())
笔记
我不是用这个来打印的。这只是为了演示。
start_date和end_date变量是datetime。date对象,因为我不需要时间戳。(它们将用于生成报告)。
样例输出
开始日期为2009-05-30,结束日期为2009-06-09:
2009-05-30
2009-05-31
2009-06-01
2009-06-02
2009-06-03
2009-06-04
2009-06-05
2009-06-06
2009-06-07
2009-06-08
2009-06-09
import datetime
def daterange(start, stop, step=datetime.timedelta(days=1), inclusive=False):
# inclusive=False to behave like range by default
if step.days > 0:
while start < stop:
yield start
start = start + step
# not +=! don't modify object passed in if it's mutable
# since this function is not restricted to
# only types from datetime module
elif step.days < 0:
while start > stop:
yield start
start = start + step
if inclusive and start == stop:
yield start
# ...
for date in daterange(start_date, end_date, inclusive=True):
print strftime("%Y-%m-%d", date.timetuple())
此函数通过支持负步长等功能,可以实现超出严格要求的功能。只要分解了范围逻辑,就不需要单独的day_count,最重要的是,当从多个地方调用函数时,代码变得更容易阅读。
为什么有两个嵌套迭代?对我来说,它只用一次迭代就产生了相同的数据列表:
for single_date in (start_date + timedelta(n) for n in range(day_count)):
print ...
没有列表被存储,只有一个生成器被迭代。此外,生成器中的“if”似乎是不必要的。
毕竟,线性序列应该只需要一个迭代器,而不是两个。
与John Machin讨论后更新:
也许最优雅的解决方案是使用生成器函数来完全隐藏/抽象日期范围内的迭代:
from datetime import date, timedelta
def daterange(start_date, end_date):
for n in range(int((end_date - start_date).days)):
yield start_date + timedelta(n)
start_date = date(2013, 1, 1)
end_date = date(2015, 6, 2)
for single_date in daterange(start_date, end_date):
print(single_date.strftime("%Y-%m-%d"))
注意:为了与内置的range()函数保持一致,此迭代在到达end_date之前停止。因此,对于包容性迭代使用第二天,就像使用range()一样。
下面做一个按天递增的范围怎么样:
for d in map( lambda x: startDate+datetime.timedelta(days=x), xrange( (stopDate-startDate).days ) ):
# Do stuff here
startDate和stopDate是datetime。日期对象
对于通用版本:
for d in map( lambda x: startTime+x*stepTime, xrange( (stopTime-startTime).total_seconds() / stepTime.total_seconds() ) ):
# Do stuff here
startTime和stopTime是datetime。日期或datetime。datetime对象
(两者应是同一类型)
stepTime是一个timedelta对象
注意.total_seconds()只在python 2.7之后才被支持。如果你被早期版本困住了,你可以写自己的函数:
def total_seconds( td ):
return float(td.microseconds + (td.seconds + td.days * 24 * 3600) * 10**6) / 10**6
Numpy的arange函数可以应用于日期:
import numpy as np
from datetime import datetime, timedelta
d0 = datetime(2009, 1,1)
d1 = datetime(2010, 1,1)
dt = timedelta(days = 1)
dates = np.arange(d0, d1, dt).astype(datetime)
astype的用途是从numpy转换。Datetime64到datetime数组。datetime对象。
你可以使用箭头:
这是一个来自文档的例子,在几个小时内迭代:
from arrow import Arrow
>>> start = datetime(2013, 5, 5, 12, 30)
>>> end = datetime(2013, 5, 5, 17, 15)
>>> for r in Arrow.range('hour', start, end):
... print repr(r)
...
<Arrow [2013-05-05T12:30:00+00:00]>
<Arrow [2013-05-05T13:30:00+00:00]>
<Arrow [2013-05-05T14:30:00+00:00]>
<Arrow [2013-05-05T15:30:00+00:00]>
<Arrow [2013-05-05T16:30:00+00:00]>
要在几天内迭代,你可以这样使用:
>>> start = Arrow(2013, 5, 5)
>>> end = Arrow(2013, 5, 5)
>>> for r in Arrow.range('day', start, end):
... print repr(r)
(没有检查你是否能通过datetime。日期对象,但无论如何箭头对象通常更容易)