open-telemetry · cijothomas · Aug 7, 2024 · Aug 6, 2024 · Aug 6, 2024 · Aug 6, 2024
@@ -6,9 +6,9 @@
     RAM: 64.0 GB
     | Test                           | Average time|
     |--------------------------------|-------------|
-    | Counter_Add_Sorted             | 560 ns      |
-    | Counter_Add_Unsorted           | 565 ns      |
-    | Counter_Overflow               | 568 ns      |
+    | Counter_Add_Sorted             | 193 ns      |
+    | Counter_Add_Unsorted           | 209 ns      |
+    | Counter_Overflow               | 898 ns      |
     | ThreadLocal_Random_Generator_5 |  37 ns      |
 */
 

@@ -1,4 +1,6 @@
-use std::sync::atomic::{AtomicBool, Ordering};
+use std::collections::HashSet;
+use std::sync::atomic::{AtomicBool, AtomicUsize, Ordering};
+use std::sync::Arc;
 use std::vec;
 use std::{
     collections::HashMap,
@@ -8,19 +10,21 @@
 
 use crate::metrics::data::{self, Aggregation, DataPoint, Temporality};
 use crate::metrics::AttributeSet;
+use once_cell::sync::Lazy;
 use opentelemetry::KeyValue;
 use opentelemetry::{global, metrics::MetricsError};
 
-use super::{
-    aggregate::{is_under_cardinality_limit, STREAM_OVERFLOW_ATTRIBUTE_SET},
-    AtomicTracker, Number,
-};
+use super::{aggregate::is_under_cardinality_limit, AtomicTracker, Number};
+
+pub(crate) static STREAM_OVERFLOW_ATTRIBUTES: Lazy<Vec<KeyValue>> =
+    Lazy::new(|| vec![KeyValue::new("otel.metric.overflow", "true")]);
 
 /// The storage for sums.
 struct ValueMap<T: Number<T>> {
-    values: RwLock<HashMap<AttributeSet, T::AtomicTracker>>,
+    values: RwLock<HashMap<Vec<KeyValue>, Arc<T::AtomicTracker>>>,
     has_no_value_attribute_value: AtomicBool,
     no_attribute_value: T::AtomicTracker,
+    count: AtomicUsize,
 }
 
 impl<T: Number<T>> Default for ValueMap<T> {
@@ -35,42 +39,59 @@
             values: RwLock::new(HashMap::new()),
             has_no_value_attribute_value: AtomicBool::new(false),
             no_attribute_value: T::new_atomic_tracker(),
+            count: AtomicUsize::new(0),
         }
     }
 }
 
 impl<T: Number<T>> ValueMap<T> {
-    fn measure(&self, measurement: T, attrs: AttributeSet) {
+    fn measure(&self, measurement: T, attrs: &[KeyValue]) {
         if attrs.is_empty() {
             self.no_attribute_value.add(measurement);
             self.has_no_value_attribute_value
                 .store(true, Ordering::Release);
         } else if let Ok(values) = self.values.read() {
-            if let Some(value_to_update) = values.get(&attrs) {
+            // Try incoming order first
+            if let Some(value_to_update) = values.get(attrs) {
                 value_to_update.add(measurement);
-                return;
             } else {
-                drop(values);
-                if let Ok(mut values) = self.values.write() {
-                    // Recheck after acquiring write lock, in case another
-                    // thread has added the value.
-                    if let Some(value_to_update) = values.get(&attrs) {
-                        value_to_update.add(measurement);
-                        return;
-                    } else if is_under_cardinality_limit(values.len()) {
-                        let new_value = T::new_atomic_tracker();
-                        new_value.add(measurement);
-                        values.insert(attrs, new_value);
-                    } else if let Some(overflow_value) =
-                        values.get_mut(&STREAM_OVERFLOW_ATTRIBUTE_SET)
-                    {
-                        overflow_value.add(measurement);
-                        return;
-                    } else {
-                        let new_value = T::new_atomic_tracker();
-                        new_value.add(measurement);
-                        values.insert(STREAM_OVERFLOW_ATTRIBUTE_SET.clone(), new_value);
-                        global::handle_error(MetricsError::Other("Warning: Maximum data points for metric stream exceeded. Entry added to overflow. Subsequent overflows to same metric until next collect will not be logged.".into()));
+                // Then try sorted order.
+                let sorted_attrs = AttributeSet::from(attrs).into_vec();
+                if let Some(value_to_update) = values.get(sorted_attrs.as_slice()) {
+                    value_to_update.add(measurement);
+                } else {
+                    // Give up the lock, before acquiring write lock.
+                    drop(values);
+                    if let Ok(mut values) = self.values.write() {
+                        // Recheck both incoming and sorted after acquiring
+                        // write lock, in case another thread has added the
+                        // value.
+                        if let Some(value_to_update) = values.get(attrs) {
+                            value_to_update.add(measurement);
+                        } else if let Some(value_to_update) = values.get(sorted_attrs.as_slice()) {
+                            value_to_update.add(measurement);
+                        } else if is_under_cardinality_limit(self.count.load(Ordering::SeqCst)) {
+                            let new_value = T::new_atomic_tracker();
+                            new_value.add(measurement);
+                            let new_value = Arc::new(new_value);
+
+                            // Insert original order
+                            values.insert(attrs.to_vec(), new_value.clone());
+
+                            // Insert sorted order
+                            values.insert(sorted_attrs, new_value);
+
+                            self.count.fetch_add(1, Ordering::SeqCst);
+                        } else if let Some(overflow_value) =
+                            values.get(STREAM_OVERFLOW_ATTRIBUTES.as_slice())
+                        {
+                            overflow_value.add(measurement);
+                        } else {
+                            let new_value = T::new_atomic_tracker();
+                            new_value.add(measurement);
+                            values.insert(STREAM_OVERFLOW_ATTRIBUTES.clone(), Arc::new(new_value));
+                            global::handle_error(MetricsError::Other("Warning: Maximum data points for metric stream exceeded. Entry added to overflow. Subsequent overflows to same metric until next collect will not be logged.".into()));
+                        }
                     }
                 }
             }
@@ -100,7 +121,6 @@
     }
 
     pub(crate) fn measure(&self, measurement: T, attrs: &[KeyValue]) {
-        let attrs: AttributeSet = attrs.into();
         self.value_map.measure(measurement, attrs)
     }
 
@@ -125,12 +145,9 @@
         s_data.is_monotonic = self.monotonic;
         s_data.data_points.clear();
 
-        let mut values = match self.value_map.values.write() {
-            Ok(v) => v,
-            Err(_) => return (0, None),
-        };
-
-        let n = values.len() + 1;
+        // Max number of data points need to account for the special casing
+        // of the no attribute value + overflow attribute.
+        let n = self.value_map.count.load(Ordering::SeqCst) + 2;
         if n > s_data.data_points.capacity() {
             s_data
                 .data_points
@@ -152,23 +169,29 @@
             });
         }
 
+        let mut values = match self.value_map.values.write() {
+            Ok(v) => v,
+            Err(_) => return (0, None),
+        };
+
+        let mut seen = HashSet::new();
         for (attrs, value) in values.drain() {
-            s_data.data_points.push(DataPoint {
-                attributes: attrs
-                    .iter()
-                    .map(|(k, v)| KeyValue::new(k.clone(), v.clone()))
-                    .collect(),
-                start_time: Some(prev_start),
-                time: Some(t),
-                value: value.get_value(),
-                exemplars: vec![],
-            });
+            if seen.insert(Arc::as_ptr(&value)) {
+                s_data.data_points.push(DataPoint {
+                    attributes: attrs.clone(),
+                    start_time: Some(prev_start),
+                    time: Some(t),
+                    value: value.get_value(),
+                    exemplars: vec![],
+                });
+            }
         }
 
         // The delta collection cycle resets.
         if let Ok(mut start) = self.start.lock() {
             *start = t;
         }
+        self.value_map.count.store(0, Ordering::SeqCst);
 
         (
             s_data.data_points.len(),
@@ -197,12 +220,9 @@
         s_data.is_monotonic = self.monotonic;
         s_data.data_points.clear();
 
-        let values = match self.value_map.values.write() {
-            Ok(v) => v,
-            Err(_) => return (0, None),
-        };
-
-        let n = values.len() + 1;
+        // Max number of data points need to account for the special casing
+        // of the no attribute value + overflow attribute.
+        let n = self.value_map.count.load(Ordering::SeqCst) + 2;
         if n > s_data.data_points.capacity() {
             s_data
                 .data_points
@@ -225,16 +245,18 @@
             });
         }
 
+        let values = match self.value_map.values.write() {
+            Ok(v) => v,
+            Err(_) => return (0, None),
+        };
+
         // TODO: This will use an unbounded amount of memory if there
         // are unbounded number of attribute sets being aggregated. Attribute
         // sets that become "stale" need to be forgotten so this will not
         // overload the system.
         for (attrs, value) in values.iter() {
             s_data.data_points.push(DataPoint {
-                attributes: attrs
-                    .iter()
-                    .map(|(k, v)| KeyValue::new(k.clone(), v.clone()))
-                    .collect(),
+                attributes: attrs.clone(),
                 start_time: Some(prev_start),
                 time: Some(t),
                 value: value.get_value(),
@@ -254,7 +276,7 @@
     value_map: ValueMap<T>,
     monotonic: bool,
     start: Mutex<SystemTime>,
-    reported: Mutex<HashMap<AttributeSet, T>>,
+    reported: Mutex<HashMap<Vec<KeyValue>, T>>,
 }
 
 impl<T: Number<T>> PrecomputedSum<T> {
@@ -268,7 +290,6 @@
     }
 
     pub(crate) fn measure(&self, measurement: T, attrs: &[KeyValue]) {
-        let attrs: AttributeSet = attrs.into();
         self.value_map.measure(measurement, attrs)
     }
 
@@ -294,12 +315,9 @@
         s_data.temporality = Temporality::Delta;
         s_data.is_monotonic = self.monotonic;
 
-        let mut values = match self.value_map.values.write() {
-            Ok(v) => v,
-            Err(_) => return (0, None),
-        };
-
-        let n = values.len() + 1;
+        // Max number of data points need to account for the special casing
+        // of the no attribute value + overflow attribute.
+        let n = self.value_map.count.load(Ordering::SeqCst) + 2;
         if n > s_data.data_points.capacity() {
             s_data
                 .data_points
@@ -325,17 +343,19 @@
             });
         }
 
+        let mut values = match self.value_map.values.write() {
+            Ok(v) => v,
+            Err(_) => return (0, None),
+        };
+
         let default = T::default();
         for (attrs, value) in values.drain() {
             let delta = value.get_value() - *reported.get(&attrs).unwrap_or(&default);
             if delta != default {
                 new_reported.insert(attrs.clone(), value.get_value());
             }
             s_data.data_points.push(DataPoint {
-                attributes: attrs
-                    .iter()
-                    .map(|(k, v)| KeyValue::new(k.clone(), v.clone()))
-                    .collect(),
+                attributes: attrs.clone(),
                 start_time: Some(prev_start),
                 time: Some(t),
                 value: delta,
@@ -347,6 +367,7 @@
         if let Ok(mut start) = self.start.lock() {
             *start = t;
         }
+        self.value_map.count.store(0, Ordering::SeqCst);
 
         *reported = new_reported;
         drop(reported); // drop before values guard is dropped
@@ -379,12 +400,9 @@
         s_data.temporality = Temporality::Cumulative;
         s_data.is_monotonic = self.monotonic;
 
-        let values = match self.value_map.values.write() {
-            Ok(v) => v,
-            Err(_) => return (0, None),
-        };
-
-        let n = values.len() + 1;
+        // Max number of data points need to account for the special casing
+        // of the no attribute value + overflow attribute.
+        let n = self.value_map.count.load(Ordering::SeqCst) + 2;
         if n > s_data.data_points.capacity() {
             s_data
                 .data_points
@@ -410,17 +428,18 @@
             });
         }
 
+        let values = match self.value_map.values.write() {
+            Ok(v) => v,
+            Err(_) => return (0, None),
+        };
         let default = T::default();
         for (attrs, value) in values.iter() {
             let delta = value.get_value() - *reported.get(attrs).unwrap_or(&default);
             if delta != default {
                 new_reported.insert(attrs.clone(), value.get_value());
             }
             s_data.data_points.push(DataPoint {
-                attributes: attrs
-                    .iter()
-                    .map(|(k, v)| KeyValue::new(k.clone(), v.clone()))
-                    .collect(),
+                attributes: attrs.clone(),
                 start_time: Some(prev_start),
                 time: Some(t),
                 value: delta,