我刚刚开始研究即将发布的2.8版本中的Scala集合库重新实现。熟悉2.7版本的库的人会注意到,从使用角度来看,库的变化很小。例如

> List("Paris", "London").map(_.length)
res0: List[Int] List(5, 6)

…两种版本都可以。这个图书馆非常有用:事实上它非常棒。然而,那些以前不熟悉Scala并四处摸索以了解该语言的人现在必须理解方法签名,如:

def map[B, That](f: A => B)(implicit bf: CanBuildFrom[Repr, B, That]): That

对于这样简单的功能,这是一个令人望而生畏的签名,我发现自己很难理解。我并不认为Scala有可能成为下一个Java(或/C/C++/C#)-我不相信它的创造者是瞄准这个市场的-但我认为Scala成为下一代Ruby或Python(即获得大量商业用户)是可行的

这会让人们不去斯卡拉吗?这会不会让斯卡拉在商业界名声扫地,因为它是一种只有专业的博士生才能理解的学术游戏?首席技术官和软件负责人会被吓跑吗?图书馆重新设计是否明智?如果你在商业上使用Scala,你会担心吗?您是否计划立即采用2.8版本,还是等待结果?

Steve Yegge曾攻击Scala(在我看来是错误的),因为他认为Scala的类型系统过于复杂。我担心有人会用这个API来传播FUD(类似于Josh Bloch如何吓得JCP不敢向Java添加闭包)。

注意-我应该清楚,虽然我认为约书亚·布洛赫在拒绝BGGA关闭提案方面有影响力,但我不认为这是因为他诚实地认为该提案代表了错误。


尽管我的妻子和同事一直在告诉我,我并不认为自己是个白痴:我在牛津大学获得了很好的数学学位,我已经在商业编程近12年,在Scala编程大约一年(也是商业编程)。

请注意,煽动性主题标题引用了20世纪80年代初英国一个政党的宣言。这个问题是主观的,但这是一个真实的问题,我已经把它改成了CW,我想就此事发表一些意见。


当前回答

似乎有必要在这里注明自己的学位:政治学学士和计算机科学学士。

说到点子上:

这会让人们不去斯卡拉吗?

Scala很难,因为它的底层编程范式很难。函数式编程让很多人害怕。在PHP中构建闭包是可能的,但人们很少这样做。因此,如果人们没有特定的教育来让他们重视底层范式的力量,那么不,不是这个签名,而是其他所有签名都会让人们望而却步。

如果这种教育是可行的,每个人都可以做到。去年我在SCALA和一群学生一起制作了一台国际象棋电脑!他们有自己的问题,但最终还是做得很好。

如果你在商业上使用Scala,你会担心吗?您是否计划立即采用2.8版本,还是等待结果?

我不会担心的。

其他回答

我是一个Scala初学者,老实说,我看不出那种类型签名有什么问题。参数是要映射的函数,隐式参数是生成器返回正确集合的参数。清晰易读。

事实上,整件事很优雅。生成器类型参数允许编译器选择正确的返回类型,而隐式参数机制对类用户隐藏此额外参数。我试过了:

Map(1 -> "a", 2 -> "b").map((t) => (t._2) -> (t._1)) // returns Map("a" -> 1, "b" -> 2)
Map(1 -> "a", 2 -> "b").map((t) =>  t._2)            // returns List("a", "b")

多态性做得很好。

当然,这不是一种主流范式,它会吓跑很多人。但是,它也会吸引许多看重其表现力和优雅的人。

我希望这不是“遗书”,但我明白你的意思。您发现了Scala的优点和问题:它的可扩展性。这使我们能够实现库中的大多数主要功能。在其他一些语言中,带有map或collect之类的序列将被内置,没有人需要了解编译器要使其顺利工作所需的所有步骤。在Scala中,它都在一个库中,因此是公开的。

事实上,复杂类型支持的地图功能非常先进。考虑一下:

scala> import collection.immutable.BitSet
import collection.immutable.BitSet

scala> val bits = BitSet(1, 2, 3)
bits: scala.collection.immutable.BitSet = BitSet(1, 2, 3)

scala> val shifted = bits map { _ + 1 }
shifted: scala.collection.immutable.BitSet = BitSet(2, 3, 4)

scala> val displayed = bits map { _.toString + "!" }
displayed: scala.collection.immutable.Set[java.lang.String] = Set(1!, 2!, 3!)

看看你总是如何得到最好的类型?如果将Ints映射到Ints,则会再次获得一个BitSet,但如果将Int映射到Strings,则将获得一个通用Set。映射结果的静态类型和运行时表示都取决于传递给它的函数的结果类型。即使集合为空,这也有效,因此函数永远不会被应用!据我所知,没有其他集合框架具有同等功能。然而,从用户的角度来看,这就是事情应该如何工作的。

我们面临的问题是,所有实现这一点的巧妙技术都会泄露到类型签名中,而这些签名变得又大又吓人。但也许默认情况下不应该向用户显示地图的完整类型签名?如果她在BitSet中查找地图,她会得到:

map(f: Int => Int): BitSet     (click here for more general type)

在这种情况下,文档不会说谎,因为从用户的角度来看,map确实具有类型(Int=>Int)=>BitSet。但地图也有一个更通用的类型,可以通过单击另一个链接来查看。

我们还没有在工具中实现这样的功能。但我认为我们需要这样做,以避免吓跑人们,并提供更多有用的信息。有了这样的工具,希望智能框架和库不会成为自杀笔记。

我不知道该怎么告诉你,但我有剑桥大学的博士学位,我用的是2.8。

更严重的是,我几乎没有花时间使用2.7(它不会与我正在使用的Java库互操作),一个多月前才开始使用Scala。我对Haskell有一些经验(不多),但只是忽略了你担心的东西,并寻找与我的Java经验相匹配的方法(我以Java为生)。

所以:我是一个“新用户”,我并没有被推迟——事实上,它的工作方式与Java类似,这给了我足够的信心,可以忽略我不理解的部分。

(然而,我之所以选择Scala,部分原因是想看看是否要在工作中推动它,我现在还不打算这么做。让文档变得不那么吓人肯定会有所帮助,但让我惊讶的是,它仍在不断变化和开发中(公平地说,最让我吃惊的是它是多么棒,但变化紧随其后)。所以我想我想说的是,我更希望把有限的资源投入到最终的状态中——我认为他们不会期望很快就会如此流行。)

我没有博士学位,也没有任何其他学位,既没有计算机科学,也没有数学,也没有其他领域。我以前没有使用Scala或任何其他类似语言的经验。我甚至没有使用远程可比类型系统的经验。事实上,我所掌握的不仅仅是表面知识,甚至还有一种类型系统的语言是Pascal,它并不完全以其复杂的类型系统而闻名。(虽然它确实有范围类型,而AFAIK几乎没有其他语言有,但这在这里并不重要。)我知道的其他三种语言是BASIC、Smalltalk和Ruby,它们都没有类型系统。

然而,我完全不难理解你发布的地图函数的签名。在我看来,这与地图上我见过的其他语言的签名几乎相同。不同的是,这个版本更通用。它看起来更像C++STL,而不是Haskell。特别是,它通过仅要求参数为IterableLike来抽象具体的集合类型,并且通过仅要求存在隐式转换函数来抽象具体返回类型,该函数可以从结果值集合中构建一些东西。是的,这很复杂,但它实际上只是泛型编程的一般范式的一种表达:不要假设任何实际上不需要的东西。

在这种情况下,map实际上不需要集合是列表,也不需要被排序或可排序等。地图唯一关心的是,它可以一个接一个地访问集合的所有元素,但没有特定的顺序。它不需要知道生成的集合是什么,只需要知道如何构建它。因此,这就是它的类型签名所要求的。

所以

map :: (a → b) → [a] → [b]

这是映射的传统类型签名,它一般不需要具体的List,而只需要IterableLike数据结构

map :: (IterableLike i, IterableLike j) ⇒ (a → b) → i → j

然后通过仅要求存在能够将结果转换为用户想要的任何数据结构的函数来进一步概括:

map :: IterableLike i ⇒ (a → b) → i → ([b] → c) → c

我承认语法有点笨拙,但语义是一样的。基本上,它从

def map[B](f: (A) ⇒ B): List[B]

这是地图的传统签名。(注意,由于Scala的面向对象特性,输入列表参数是如何消失的,因为它现在是单个分派OO系统中每个方法都具有的隐式接收器参数。)

def map[B](f: (A) ⇒ B): IterableLike[B]

现在,它用一个函数替换了IterableLike结果集合,这个函数实际上可以产生任何东西。

def map[B, That](f: A ⇒ B)(implicit bf: CanBuildFrom[Repr, B, That]): That

我真的相信这并不难理解。你只需要几个智能工具:

你需要知道(大致)map是什么。我承认,如果你只给出了类型签名,而没有给出方法的名称,那么很难弄清楚到底发生了什么。但既然你已经知道map应该做什么,而且你知道它的类型签名应该是什么,你就可以快速扫描签名并关注异常情况,比如“为什么这个映射将两个函数作为参数,而不是一个?”您需要能够实际读取类型签名。但是,即使您以前从未见过Scala,这也应该很容易,因为它实际上是您从其他语言中已经知道的类型语法的混合:VB.NET使用方括号来表示参数多态性,使用箭头表示返回类型,使用冒号来分隔名称和类型,这实际上是一种规范。您需要大致了解泛型编程是什么。(这并不难理解,因为它基本上都是用名称拼写的:它实际上只是以通用方式编程)。

这三项都不应该让任何专业程序员甚至业余程序员头疼。在过去的50年中,map已经成为几乎每一种语言的标准功能,不同的语言都有不同的语法,这一事实对于任何使用HTML和CSS设计网站的人来说都是显而易见的,如果没有一些来自圣教堂的讨厌的C++粉丝,你就无法订阅甚至远程编程相关的邮件列表。Stepanov解释泛型编程的优点。

是的,Scala很复杂。是的,Scala是人类所知的最复杂的类型系统之一,可以媲美甚至超越Haskell、Miranda、Clean或Cyclone等语言。但如果复杂性是一种编程语言成功的理由,C++早就死了,我们都会写Scheme。Scala很可能不会成功的原因有很多,但程序员在坐在键盘前不必费心动脑这一事实可能不是主要原因。

Scala社区可以帮助减轻新手程序员对Scala的恐惧,其中一个方法就是专注于实践,并通过实例进行教学——很多实例都是从小开始,逐渐长大的。以下是一些采用这种方法的网站:

每日Scala学习Scala简单Scala

在这些网站上花了一段时间后,人们很快意识到Scala及其库虽然可能很难设计和实现,但使用起来并不那么困难,特别是在常见情况下。