-
JAVA集合概述
集合类主要负责保存、盛装其他数据,因此集合类也被称为容器类。所有的集合类的都在java.util包下。
集合类和数组不一样,数组元素既可以是基本类型的值,也可以是对象(实际上保存的是对象的引用变量);而集合只能保存对象。
Java的集合类主要由Collections和Map,Collections和Map是Java集合框架的根接口,Java中集合的继承关系如下:
Collection集合列的继承关系
Map接口的继承关系
2、Collection接口和Iterator接口
一、Collection接口
collection接口是List、set和Queue接口的父接口,该接口里定义的方法可用于操作Set集合。并且所有的Collection实现类都重写了toString()方法.
遍历集合的两种方法:
- 使用lamdba遍历
1 public class CollectionEach{ 2 public static void main(String[] args){ 3 Collection readBooks=new HashSet(); 4 readBooks.add("Java 多线程边编程的艺术"); 5 readBooks.add("Java编程思想"); 6 readBooks.add("简洁之道"); 7 readBooks.add("Effective Java"); 8 readBooks.add("程序员职业素养"); 9 readBooks.foreach(ele->System.out.println("迭代集合元素:"+ele)); 10 } 11 }
在java8中Iterable接口新增了一个forEach(Consumser action)方法,而Iterable接口是Collection接口的父接口,因此Collection集合也可直接调用该方法。
2.使用Java8增强Iterator遍历集合
package com.ynu.java.learn.base.MutilThread; import java.util.Collection; import java.util.HashSet; import java.util.Iterator; /** * @author root * */ public class IteratorTest { /** * @param args */ public static void main(String[] args) { // TODO Auto-generated method stub Collection<String> books = new HashSet<>(); books.add("明朝那些事"); books.add("三国演义!"); books.add("水浒传!"); books.add("Java编程思想"); Iterator<String> it = books.iterator(); while (it.hasNext()) { // it.next()方法返回的数据类型是Object类型,因此需要强制类型转换 String book = it.next(); System.out.println(book); if (book.equals("三国演义!")) { it.remove(); } // 对book变量赋值,不会改变集合元素本身 book = "测试字符串"; } System.out.println(books); } }
当使用Iterator对集合元素进行迭代时,Iterator并不是把集合元素本身传给了迭代变量,而是把集合元素的值传给了迭代变量,因此修改迭代变量的值对集合元素本身没有任何影响。
当使用Iterator迭代访问Collection集合元素时,不能使用Collection对象修改Collection集合里的元素,但是可以使用Iterator的remove()方法删除上一次next()方法返回集合元素,否则将会引发java.util.Concurrent.ModificationException异常。
import java.util.Collection; import java.util.HashSet; import java.util.Iterator; /** * @author root * */ public class IteratorTest { /** * @param args */ public static void main(String[] args) { // TODO Auto-generated method stub Collection<String> books = new HashSet<>(); books.add("明朝那些事"); books.add("三国演义!"); books.add("水浒传!"); books.add("Java编程思想"); Iterator<String> it = books.iterator(); while (it.hasNext()) { // it.next()方法返回的数据类型是Object类型,因此需要强制类型转换 String book = it.next(); System.out.println(book); if (book.equals("三国演义!")) { books.remove("三国演义!"); } // 对book变量赋值,不会改变集合元素本身 book = "测试字符串"; } System.out.println(books); } }
使用Java8新增的Predicate操作集合
Java 8为Collection集合新增了removeIf(Predicate filter)方法,该方法将会批量删除符合条件的filter条件的所有元素。示例如下:
import java.util.Collection; import java.util.HashSet; /** * @author root * */ public class PredicateTest { /** * @param args */ public static void main(String[] args) { // TODO Auto-generated method stub Collection<String> books = new HashSet<>(); books.add(new String("轻量级Java EE企业应用实战")); books.add(new String("疯狂Java讲义")); books.add(new String("疯狂iOS讲义")); books.add(new String("疯狂Ajax讲义")); books.add(new String("疯狂Android讲义")); System.out.println(books); // 使用lambda表达式(目标类型是Predicate)过滤集合 books.removeIf(ele -> ele.length() < 10); System.out.println(books); } }
Predicate使用示例2:
import java.util.Collection; import java.util.HashSet; import java.util.function.Predicate; /** * @author root * */ public class PredicateTest2 { /** * @param args */ public static void main(String[] args) { // TODO Auto-generated method stub Collection<String> books = new HashSet<>(); books.add("Java编程思想"); books.add("Java疯狂讲义"); books.add("代码整洁之道_程序员的职业素养"); books.add("java并发编程的艺术"); books.add("TensorFlow 实战深度学习框架"); books.add("人际关系与沟通"); books.add("Effective java"); books.add("代码整洁之道"); books.add("TensorFlow实战"); // 统计书名包含"Java"子串的图书数量 System.out.println(calAll(books, ele -> ((String) ele).contains("Java"))); // 统计书名包含"疯狂"子串的图书数量 System.out.println(calAll(books, ele -> ((String) ele).contains("疯狂"))); // 统计书名字符长度大于10的图书数量 System.out.println(calAll(books, ele -> ((String) ele).length() > 10)); } /** * @param books * @param object * @return */ private static int calAll(Collection<String> books, Predicate p) { // TODO Auto-generated method stub int total = 0; for (Object obj : books) { if (p.test(obj)) { total++; } } return total; } }
使用java 8 新增的Stream操作集合
Java8新增了Stream、IntStream、LongStream、DoubleStream等流式API,这些API代表了多个支持串行和并行聚集操作的元素,其中Stream是一个通用的流接口,而IntStream、LongStream、DoubleStream则代表了类型为int,long,double的流。
独立使用Stream的步骤如下:
1、使用Stream或XxxStream的builder()类方法创建该Stream对应的Builder。
2、重复调用Builder的add()方法向该流中的添加多个元素
3、调用Builder的build()方法获取对应的Stream
4、调用Stream的聚集方法。
package com.edu.ynu.java.learn.collection; import java.util.stream.IntStream; public class IntStreamTest { public static void main(String[] args) { IntStream is = IntStream.builder().add(12).add(23).add(-2).add(4).build(); //下面调用聚集方法的代码每次只能执行一次 /* System.out.println("is所有元素的最大值:" + is.max().getAsInt()); System.out.println("is所有元素的最小值:" + is.min().getAsInt()); System.out.println("is所有元素的总和:" + is.sum()); System.out.println("is所有元素的总数:" + is.count()); System.out.println("is所有元素的平均值:" + is.average()); System.out.println("is所有元素的平方是否都大于20:" + is.allMatch(ele -> ele * ele > 20)); System.out.println("is是否包含任何元素的平法大于20:" + is.anyMatch(ele -> ele * ele > 20));*/ //将is映射成一个新的Stream,新Stream的每个元素是原Stream元素的2倍+1 IntStream newIs = is.map(ele -> ele * 2 + 1); //使用方法引用的方式来遍历集合元素 newIs.forEach(System.out::println); } }
在Stream中方法分为两类中间方法和末端方法
- 中间方法:中间操作允许流保持打开状态,并允许直接调用后续方法。上面程序中的map()方法就是中间方法。
- 末端方法:末端方法是对流的最终操作。当对某个Stream执行末端方法后,该流将会被"消耗"且不再可用。上面程序中的sum()、count()、average()等方法都是末端方法。
除此之外,关于流的方法还有如下特征:
- 有状态的方法:这种方法会给你流增加一些新的属性,比如元素的唯一性、元素的最大数量、保证元素的排序的方式被处理等。有状态的方法往往需要更大的性能开销
短路方法:短路方法可以尽早结束对流的操作,不必检查所有的元素。
import java.util.Collection; import java.util.HashSet; public class CollectionStream { public static void main(String[] args) { Collection books = new HashSet(); books.add("Java并发编程的艺术"); books.add("Effective java 中文版"); books.add("代码整洁之道"); books.add("深度学习、优化与识别"); books.add("代码整洁之道_程序员的职业素养"); books.add("人际关系与沟通"); books.add("TensorFlow实战"); books.add("TensorFlow实战Google深度学习框架"); books.add("明朝那些事"); //统计书名包含"码"子串的图书数量 System.out.println(books.stream().filter(ele -> ((String) ele).contains("码")).count()); //统计书名包含"java"子串的图书数量 System.out.println(books.stream().filter(ele -> ((String) ele).contains("Java")).count()); //统计书名字符串长度大于10的图书数量 System.out.println(books.stream().filter(ele -> ((String) ele).length() > 10).count()); //先调用Collection对象的stream()方法将集合转换为Stream //再调用Stream的mapToInt()方法获取原有的Stream对应的IntStream books.stream().mapToInt(ele -> ((String) ele).length()).forEach(System.out::println); } }
Set集合
HashSet
HashSet是Set接口的典型的实现。HashSet按Hash算法来存储集合中的元素。在存取和查找上有很好的性能。
HashSet具有以下特点:
1、不能保证元素的排列顺序,顺序可能与添加顺序不同,顺序也有可能发生变化。
2、HashSet不是同步的,必须通过代码来保证其同步。
3、集合元素可以是null.
当向HashSet集合中存入一个元素时,HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值,然后根据该hashCode值决定该hashCode值决定该对象在HashSet中存储的位置。
如果有两个元素通过equals()方法比较返回true,但它们的hashCode()方法返回值不相等,hashSet将会把它们存储在不同位置,依然可以添加成功。如果两个对象的hashCode()方法返回的hashCode值相同,当它们的equals()方法返回false时,会在hashCode所在位置采用链式结构保存多个对象。这样会降低hashSet的查询性能。
综上所述:HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等,并且两个hashCode()方法的返回值也相等。
在使用HashSet中重写hashCode()方法的基本原则
1、在程序运行过过程中,同一个对象多次调用hashCode()方法应该返回相同的值。
2、当两个对象的equals()方法比较返回true时,这个两个对象的hashCode()方法返回相同的值。
3、对象中用作equals()方法比较标准的实例变量,都应该用于计算hashCode值。
- 把对象内的每个意义的实例变量(即每个参与equals()方法比较标准的实例变量)计算出一个int类型的hashCode值。
实例变量类型 | 计算方式 |
boolean | hashCode=(f?0:1); |
整数类型(byte、short、char、int) | hashCode=(int)f; |
long | hashCode=(int)(f^(f>>>32)); |
float | hashCode=Float.floattoIntBits(f); |
double | long l=Double.doubleToLongBits(f); hashCode=(int)(I^(I>>>32)); |
引用类型 |
2.用第1步计算出来的多个hashCode值组合计算出一个hashCode值返回
1 return f1.hashCode()+(int)f2;
为了避免直接相加产生的偶然相等(两个对象的f1、f2实例变量并不相等,但他们的hashCode的和恰好相等),可以通过为各个实例变量的hashCode值乘以一个质数后再相加
1 return f1.hashCode()*19+f2.hashCode()*37;
如果向HashSet中添加一个可变的对象后,后面的程序修改了该可变对想的实例变量,则可能导致它与集合中的其他元素的相同(即两个对象的equals()方法比较返回true,两个对象的hashCode值也相等),这就有可能导致HashSet中包含两个相同的对象。
1 import java.util.HashSet; 2 import java.util.Iterator; 3 4 public class HashTest2 5 { 6 public static void main(String[] args) 7 { 8 HashSet hs = new HashSet(); 9 hs.add(new R(5)); 10 hs.add(new R(-3)); 11 hs.add(new R(-9)); 12 hs.add(new R(15)); 13 //打印HashSet集合,集合 元素没有重复 14 System.out.println(hs); 15 //取出第一个元素 16 Iterator it = hs.iterator(); 17 R first = (R) it.next(); 18 System.out.println(first.count); 19 // 为第一个元素的count实例变量赋值 20 first.count = -3; 21 System.out.println(hs); 22 //删除count为-3的R对象 23 hs.remove(new R(-3)); 24 //可以看到被删除了一个R元素 25 System.out.println(hs); 26 System.out.println("hs是否包含count为-3的R对象?" + hs.contains(new R(-3))); //输出false 27 System.out.println("hs是否包含count为-2的R对象?" + hs.contains(new R(-2))); //输出false 28 } 29 } 30 31 class R 32 { 33 int count; 34 35 public R(int count) 36 { 37 this.count = count; 38 } 39 40 public String toString() 41 { 42 return "R[count:" + count + "]"; 43 } 44 45 public boolean equals(Object obj) 46 { 47 if (this == obj) 48 { 49 return true; 50 } 51 if (obj != null && obj.getClass() == R.class) 52 { 53 R r = (R) obj; 54 return this.count == r.count; 55 } 56 return false; 57 } 58 59 public int hashCode() 60 { 61 return this.count; 62 } 63 }
程序运行的结果
[R[count:-3], R[count:5], R[count:-9], R[count:15]] -3 [R[count:-3], R[count:5], R[count:-9], R[count:15]] [R[count:5], R[count:-9], R[count:15]] hs是否包含count为-3的R对象?false hs是否包含count为-2的R对象?false
对于上述代码的解释,在执行
System.out.println("hs是否包含count为-3的R对象?" + hs.contains(new R(-3)));
时,首先去查找HashSet中通过-3计算得出的元素的位置,这里元素为-3已经删除了,所以找不到数值为-3的元素的值
对于执行
System.out.println("hs是否包含count为-3的R对象?" + hs.contains(new R(-2)));
时,因为通过后面的修改的已经将z值为-2的元素对应的hashCode的元素的值改为-3,也就是说找到了对应的HashCode对应位置的上的元素,但是元素对应的值与-2不相等,所以返回也为false
LinkedHashSet
LinkedHashSet集合也是根据hashCode值据决定元素的存储位置的,但它同时使用链表维护元素的次序,存储的顺序是元素插入的顺序。
LinkedHashSet需要维护元素的插入的顺序,因此性能略低于HashSet的性能,但在迭代方位Set里的全部元素时将有很好的性能,因为它以链表来维护内部顺序。
1 import java.util.LinkedHashSet; 2 3 public class LinkedHashSetTest 4 { 5 public static void main(String[] args) 6 { 7 LinkedHashSet books = new LinkedHashSet(); 8 books.add("疯狂Java讲义"); 9 books.add("轻量级Java EE企业应用实战"); 10 books.add("Java并发编程的艺术"); 11 String a = null; 12 books.add(a); 13 System.out.println(books); 14 15 // 删除 疯狂Java讲义 16 books.remove("疯狂Java讲义"); 17 // 重新添加 疯狂Java 讲义 18 books.add("疯狂Java讲义"); 19 System.out.println(books); 20 } 21 }
TreeSet
TreeSet是SortedSet接口的实现类,TreeSet可以保证集合元素处于排序状态
1 package com.edu.ynu.java.learn.collection; 2 3 import java.util.TreeSet; 4 5 public class TreeSetTest 6 { 7 public static void main(String[] args) 8 { 9 TreeSet nums = new TreeSet(); 10 nums.add(15); 11 nums.add(20); 12 nums.add(-1); 13 nums.add(-19); 14 // 输出集合元素,看到集合元素已经处于排序状态 15 System.out.println(nums); 16 // 输出集合中的第一个元素 17 System.out.println(nums.first()); 18 // 输出集合中最后一个元素 19 System.out.println(nums.last()); 20 // 返回小于4的子集,不包含4 21 System.out.println(nums.headSet(2)); 22 // 返回大于5的子集 23 System.out.println(nums.tailSet(3)); 24 // 返回大于等于-6,小于4的子集 25 System.out.println(nums.subSet(-6, 4)); 26 } 27 }
TreeSet采用红黑树的数据结构来存储集合元素
TreeSet支持两种的排序方法:自然排序和定制排序,在默认的情况下,TreeSet采用自然排序
1、自然排序
TreeSet会调用集合元素的compareTo(Oject obj)方法来比较元素之间的大小关系,然后将集合元素按升序排列
如果试图把一个对象添加到TreeSet时,则该对象的类必须实现Comparable接口,否则程序将会抛出异常
1 class Err{} 2 public class TreeSetErrorTest 3 { 4 public static void main(String[] args){ 5 TreeSet ts=new TreeSet(); 6 ts.add(new Err()); 7 ts.add(new Err()); 8 } 9 }
上述代码没有实现的Comparable接口,则会引发ClassCastException异常。
向TreeSet中添加的应该是同一类的对象否则也会引发ClassCastException异常。
对于TreeSet集合而言,它判断两个对象的是否相等的唯一标准是:两个对象的通过compareTo(Object obj)方法比较是否返回0--如果通过compareTo(Object obj)方法比较返回0,TreeSet则会认为它们相等,否则认为它们不相等。