因此,我试图使这个程序,将要求用户输入,并将值存储在一个数组/列表。
然后,当输入空行时,它会告诉用户这些值中有多少是唯一的。
我做这个是出于现实生活的原因,而不是作为习题集。
enter: happy
enter: rofl
enter: happy
enter: mpg8
enter: Cpp
enter: Cpp
enter:
There are 4 unique words!
我的代码如下:
# ask for input
ipta = raw_input("Word: ")
# create list
uniquewords = []
counter = 0
uniquewords.append(ipta)
a = 0 # loop thingy
# while loop to ask for input and append in list
while ipta:
ipta = raw_input("Word: ")
new_words.append(input1)
counter = counter + 1
for p in uniquewords:
..到目前为止我就知道这么多
我不知道如何计算一个列表中唯一的单词数?
如果有人可以发布解决方案,这样我就可以从中学习,或者至少向我展示它是如何伟大的,谢谢!
使用集合:
words = ['a', 'b', 'c', 'a']
unique_words = set(words) # == set(['a', 'b', 'c'])
unique_word_count = len(unique_words) # == 3
有了这个,你的解决方案可以很简单:
words = []
ipta = raw_input("Word: ")
while ipta:
words.append(ipta)
ipta = raw_input("Word: ")
unique_word_count = len(set(words))
print "There are %d unique words!" % unique_word_count
以下方法应该可以工作。lambda函数过滤掉重复的单词。
inputs=[]
input = raw_input("Word: ").strip()
while input:
inputs.append(input)
input = raw_input("Word: ").strip()
uniques=reduce(lambda x,y: ((y in x) and x) or x+[y], inputs, [])
print 'There are', len(uniques), 'unique words'
另外,使用集合。计数器重构你的代码:
from collections import Counter
words = ['a', 'b', 'c', 'a']
Counter(words).keys() # equals to list(set(words))
Counter(words).values() # counts the elements' frequency
输出:
['a', 'c', 'b']
[2, 1, 1]
对于ndarray,有一个numpy方法叫做unique:
np.unique(array_name)
例子:
>>> np.unique([1, 1, 2, 2, 3, 3])
array([1, 2, 3])
>>> a = np.array([[1, 1], [2, 3]])
>>> np.unique(a)
array([1, 2, 3])
对于Series,有一个函数调用value_counts():
Series_name.value_counts()
Values, counts = np。独特的(话说,return_counts = True)
更详细地
import numpy as np
words = ['b', 'a', 'a', 'c', 'c', 'c']
values, counts = np.unique(words, return_counts=True)
函数numpy。Unique返回输入列表中已排序的唯一元素及其计数:
['a', 'b', 'c']
[2, 1, 3]
另一种方法是用熊猫
import pandas as pd
LIST = ["a","a","c","a","a","v","d"]
counts,values = pd.Series(LIST).value_counts().values, pd.Series(LIST).value_counts().index
df_results = pd.DataFrame(list(zip(values,counts)),columns=["value","count"])
然后,您可以将结果导出为所需的任何格式
你可以使用get方法:
lst = ['a', 'b', 'c', 'c', 'c', 'd', 'd']
dictionary = {}
for item in lst:
dictionary[item] = dictionary.get(item, 0) + 1
print(dictionary)
输出:
{'a': 1, 'b': 1, 'c': 3, 'd': 2}