outbrain · ggaspersic · Aug 16, 2023 · Aug 17, 2023 · Aug 17, 2023 · Aug 17, 2023
diff --git a/src/block_monte_carlo.rs b/src/block_monte_carlo.rs
@@ -0,0 +1,377 @@
+use std::any::Any;
+use std::error::Error;
+
+use rand::distributions::{Distribution, Open01, Uniform};
+use rand_xoshiro::rand_core::SeedableRng;
+use rand_xoshiro::Xoshiro256Plus;
+
+use regressor::BlockTrait;
+
+use crate::block_helpers;
+use crate::feature_buffer::FeatureBuffer;
+use crate::graph;
+use crate::port_buffer::{PortBuffer, PredictionStats};
+use crate::regressor;
+use crate::regressor::BlockCache;
+
+pub fn new_monte_carlo_block(
+    bg: &mut graph::BlockGraph,
+    input: graph::BlockPtrOutput,
+    num_iterations: usize,
+    dropout_rate: f32,
+) -> Result<graph::BlockPtrOutput, Box<dyn Error>> {
+    let num_inputs = bg.get_num_output_values(vec![&input]);
+    assert_ne!(num_inputs, 0);
+    assert_ne!(num_iterations, 0);
+
+    let number_of_inputs_to_skip = (dropout_rate * num_inputs as f32) as usize;
+    let skip_index_generator = Uniform::from(0..num_inputs);
+    let increment_generator = Open01 {};
+
+    let block = Box::new(BlockMonteCarlo {
+        num_iterations,
+        number_of_inputs_to_skip,
+        dropout_rate,
+        skip_index_generator,
+        increment_generator,
+        output_offset: usize::MAX,
+        input_offset: usize::MAX,
+        num_inputs,
+    });
+    let mut block_outputs = bg.add_node(block, vec![input])?;
+    assert_eq!(block_outputs.len(), 1);
+    Ok(block_outputs.pop().unwrap())
+}
+
+fn create_seed_from_input_tape(input_tape: &[f32]) -> u64 {
+    (input_tape.iter().sum::<f32>() * 100_000.0).round() as u64
+}
+
+pub struct BlockMonteCarlo {
+    num_iterations: usize,
+    number_of_inputs_to_skip: usize,
+    dropout_rate: f32,
+    skip_index_generator: Uniform<usize>,
+    increment_generator: Open01,
+
+    pub num_inputs: usize,
+    pub input_offset: usize,
+    pub output_offset: usize,
+}
+
+impl BlockTrait for BlockMonteCarlo {
+    fn as_any(&mut self) -> &mut dyn Any {
+        self
+    }
+
+    fn forward_backward(
+        &mut self,
+        further_blocks: &mut [Box<dyn BlockTrait>],
+        fb: &FeatureBuffer,
+        pb: &mut PortBuffer,
+        update: bool,
+    ) {
+        self.copy_input_tape_to_output_tape(pb);
+
+        block_helpers::forward_backward(further_blocks, fb, pb, update);
+
+        if update {
+            let (input_tape, output_tape) = block_helpers::get_input_output_borrows(
+                &mut pb.tape,
+                self.input_offset,
+                self.num_inputs,
+                self.output_offset,
+                self.num_inputs,
+            );
+
+            input_tape.copy_from_slice(output_tape);
+        }
+    }
+
+    fn forward(
+        &self,
+        further_blocks: &[Box<dyn BlockTrait>],
+        fb: &FeatureBuffer,
+        pb: &mut PortBuffer,
+    ) {
+        unsafe {
+            if self.number_of_inputs_to_skip == 0 {
+                self.copy_input_tape_to_output_tape(pb);
+                block_helpers::forward(further_blocks, fb, pb);
+                return;
+            }
+
+            let input_tape = pb
+                .tape
+                .get_unchecked_mut(self.input_offset..self.input_offset + self.num_inputs)
+                .to_vec();
+
+            let seed = create_seed_from_input_tape(&input_tape);
+            let mut rng = Xoshiro256Plus::seed_from_u64(seed);
+
+            for i in 0..self.num_iterations {
+                let (_, output_tape) = block_helpers::get_input_output_borrows(
+                    &mut pb.tape,
+                    self.input_offset,
+                    self.num_inputs,
+                    self.output_offset,
+                    self.num_inputs,
+                );
+
+                output_tape.copy_from_slice(&input_tape);
+                if i != 0 {
+                    let mut number_of_inputs_to_skip = self.number_of_inputs_to_skip;
+                    let sample = self.increment_generator.sample(&mut rng);
+                    if self.dropout_rate >= sample {
+                        number_of_inputs_to_skip += 1;
+                    }
+                    for _ in 0..number_of_inputs_to_skip {
+                        let skip_index = self.skip_index_generator.sample(&mut rng);
+                        *output_tape.get_unchecked_mut(skip_index) = 0.0;
+                    }
+                }
+                block_helpers::forward(further_blocks, fb, pb);
+            }
+
+            self.fill_stats(pb);
+        }
+    }
+
+    fn forward_with_cache(
+        &self,
+        further_blocks: &[Box<dyn BlockTrait>],
+        fb: &FeatureBuffer,
+        pb: &mut PortBuffer,
+        caches: &[BlockCache],
+    ) {
+        unsafe {
+            if self.number_of_inputs_to_skip == 0 {
+                self.copy_input_tape_to_output_tape(pb);
+                block_helpers::forward_with_cache(further_blocks, fb, pb, caches);
+                return;
+            }
+
+            let input_tape = pb
+                .tape
+                .get_unchecked_mut(self.input_offset..self.input_offset + self.num_inputs)
+                .to_vec();
+
+            let seed = create_seed_from_input_tape(&input_tape);
+            let mut rng = Xoshiro256Plus::seed_from_u64(seed);
+
+            for i in 0..self.num_iterations {
+                let (_, output_tape) = block_helpers::get_input_output_borrows(
+                    &mut pb.tape,
+                    self.input_offset,
+                    self.num_inputs,
+                    self.output_offset,
+                    self.num_inputs,
+                );
+
+                output_tape.copy_from_slice(&input_tape);
+                if i != 0 {
+                    let mut number_of_inputs_to_skip = self.number_of_inputs_to_skip;
+                    let sample = self.increment_generator.sample(&mut rng);
+                    if self.dropout_rate >= sample {
+                        number_of_inputs_to_skip += 1;
+                    }
+                    for _ in 0..number_of_inputs_to_skip {
+                        let skip_index = self.skip_index_generator.sample(&mut rng);
+                        *output_tape.get_unchecked_mut(skip_index) = 0.0;
+                    }
+                }
+                block_helpers::forward_with_cache(further_blocks, fb, pb, caches);
+            }
+
+            self.fill_stats(pb);
+        }
+    }
+
+    fn get_num_output_values(&self, output: graph::OutputSlot) -> usize {
+        assert_eq!(output.get_output_index(), 0);
+        self.num_inputs
+    }
+
+    fn set_input_offset(&mut self, input: graph::InputSlot, offset: usize) {
+        assert_eq!(input.get_input_index(), 0);
+        assert_eq!(self.input_offset, usize::MAX); // We only allow a single call
+        self.input_offset = offset;
+    }
+
+    fn set_output_offset(&mut self, output: graph::OutputSlot, offset: usize) {
+        assert_eq!(output.get_output_index(), 0);
+        assert_eq!(self.output_offset, usize::MAX); // We only allow a single call
+        self.output_offset = offset;
+    }
+}
+
+impl BlockMonteCarlo {
+    fn copy_input_tape_to_output_tape(&self, pb: &mut PortBuffer) {
+        let (input_tape, output_tape) = block_helpers::get_input_output_borrows(
+            &mut pb.tape,
+            self.input_offset,
+            self.num_inputs,
+            self.output_offset,
+            self.num_inputs,
+        );
+
+        output_tape.copy_from_slice(input_tape);
+    }
+
+    fn fill_stats(&self, pb: &mut PortBuffer) {
+        let mean: f32 = pb.observations.iter().sum::<f32>() / self.num_iterations as f32;
+        let variance = pb
+            .observations
+            .iter()
+            .map(|prediction| {
+                let diff = mean - prediction;
+                diff * diff
+            })
+            .sum::<f32>()
+            / self.num_iterations as f32;
+        let standard_deviation = variance.sqrt();
+
+        pb.stats = Some(PredictionStats {
+            mean,
+            variance,
+            standard_deviation,
+            count: self.num_iterations,
+        });
+    }
+}
+
+#[cfg(test)]
+mod tests {
+    use crate::assert_epsilon;
+    use crate::block_helpers::{slearn2, spredict2};
+    use crate::block_misc::Observe;
+    use crate::block_monte_carlo::new_monte_carlo_block;
+    use crate::graph::BlockGraph;
+    use crate::model_instance::ModelInstance;
+    use crate::{block_misc, feature_buffer::FeatureBuffer};
+
+    fn fb_vec() -> FeatureBuffer {
+        FeatureBuffer {
+            label: 0.0,
+            example_importance: 1.0,
+            example_number: 0,
+            lr_buffer: Vec::new(),
+            ffm_buffer: Vec::new(),
+        }
+    }
+
+    #[test]
+    fn test_monte_carlo_block_with_one_run() {
+        let mi = ModelInstance::new_empty().unwrap();
+        let mut bg = BlockGraph::new();
+        let input_block = block_misc::new_const_block(&mut bg, vec![2.0, 4.0, 4.0, 5.0]).unwrap();
+        let observe_block_backward =
+            block_misc::new_observe_block(&mut bg, input_block, Observe::Backward, None).unwrap();
+        let triangle_block =
+            new_monte_carlo_block(&mut bg, observe_block_backward, 1, 0.3).unwrap();
+        let observe_block_forward =
+            block_misc::new_observe_block(&mut bg, triangle_block, Observe::Forward, None).unwrap();
+        block_misc::new_sink_block(
+            &mut bg,
+            observe_block_forward,
+            block_misc::SinkType::Untouched,
+        )
+        .unwrap();
+        bg.finalize();
+        bg.allocate_and_init_weights(&mi);
+
+        let mut pb = bg.new_port_buffer();
+        let fb = fb_vec();
+        slearn2(&mut bg, &fb, &mut pb, true);
+        assert_eq!(pb.observations, [2.0, 4.0, 4.0, 5.0, 2.0, 4.0, 4.0, 5.0]);
+
+        spredict2(&mut bg, &fb, &mut pb);
+        let expected_observations = [2.0, 4.0, 4.0, 5.0, 2.0, 4.0, 4.0, 5.0];
+        assert_eq!(pb.observations.len(), expected_observations.len());
+        assert_eq!(pb.observations, expected_observations);
+
+        assert_ne!(pb.stats, None);
+
+        let stats = pb.stats.unwrap();
+        assert_epsilon!(stats.mean, 15.0);
+        assert_epsilon!(stats.variance, 511.0);
+        assert_epsilon!(stats.standard_deviation, 22.605309);
+    }
+
+    #[test]
+    fn test_monte_carlo_block_with_multiple_runs() {
+        let mi = ModelInstance::new_empty().unwrap();
+        let mut bg = BlockGraph::new();
+        let input_block = block_misc::new_const_block(&mut bg, vec![2.0, 4.0, 4.0, 5.0]).unwrap();
+        let observe_block_backward =
+            block_misc::new_observe_block(&mut bg, input_block, Observe::Backward, None).unwrap();
+        let triangle_block =
+            new_monte_carlo_block(&mut bg, observe_block_backward, 3, 0.3).unwrap();
+        let observe_block_forward =
+            block_misc::new_observe_block(&mut bg, triangle_block, Observe::Forward, None).unwrap();
+        block_misc::new_sink_block(
+            &mut bg,
+            observe_block_forward,
+            block_misc::SinkType::Untouched,
+        )
+        .unwrap();
+        bg.finalize();
+        bg.allocate_and_init_weights(&mi);
+
+        let mut pb = bg.new_port_buffer();
+        let fb = fb_vec();
+        slearn2(&mut bg, &fb, &mut pb, true);
+        assert_eq!(pb.observations, [2.0, 4.0, 4.0, 5.0, 2.0, 4.0, 4.0, 5.0]);
+
+        spredict2(&mut bg, &fb, &mut pb);
+        let expected_observations = [
+            2.0, 4.0, 4.0, 5.0, 2.0, 0.0, 4.0, 5.0, 2.0, 0.0, 4.0, 5.0, 2.0, 4.0, 4.0, 5.0
+        ];
+        assert_eq!(pb.observations, expected_observations);
+
+        assert_ne!(pb.stats, None);
+
+        let stats = pb.stats.unwrap();
+        assert_epsilon!(stats.mean, 12.333333);
+        assert_epsilon!(stats.variance, 354.55554);
+        assert_epsilon!(stats.standard_deviation, 18.829645);
+    }
+
+    #[test]
+    fn test_monte_carlo_block_with_multiple_runs_and_high_dropout_rate() {
+        let mi = ModelInstance::new_empty().unwrap();
+        let mut bg = BlockGraph::new();
+        let input_block = block_misc::new_const_block(&mut bg, vec![2.0, 4.0, 4.0, 5.0]).unwrap();
+        let observe_block_backward =
+            block_misc::new_observe_block(&mut bg, input_block, Observe::Backward, None).unwrap();
+        let triangle_block =
+            new_monte_carlo_block(&mut bg, observe_block_backward, 3, 0.7).unwrap();
+        let observe_block_forward =
+            block_misc::new_observe_block(&mut bg, triangle_block, Observe::Forward, None).unwrap();
+        block_misc::new_sink_block(
+            &mut bg,
+            observe_block_forward,
+            block_misc::SinkType::Untouched,
+        )
+            .unwrap();
+        bg.finalize();
+        bg.allocate_and_init_weights(&mi);
+
+        let mut pb = bg.new_port_buffer();
+        let fb = fb_vec();
+        slearn2(&mut bg, &fb, &mut pb, true);
+        assert_eq!(pb.observations, [2.0, 4.0, 4.0, 5.0, 2.0, 4.0, 4.0, 5.0]);
+        spredict2(&mut bg, &fb, &mut pb);
+        let expected_observations = [
+            2.0, 4.0, 4.0, 5.0, 2.0, 0.0, 0.0, 5.0, 2.0, 0.0, 0.0, 0.0, 2.0, 4.0, 4.0, 5.0
+        ];
+        assert_eq!(pb.observations, expected_observations);
+
+        assert_ne!(pb.stats, None);
+
+        let stats = pb.stats.unwrap();
+        assert_epsilon!(stats.mean, 8.0);
+        assert_epsilon!(stats.variance, 159.33333);
+        assert_epsilon!(stats.standard_deviation, 12.62273);
+    }
+}
diff --git a/src/cmdline.rs b/src/cmdline.rs
@@ -194,6 +194,14 @@ pub fn create_expected_args<'a>() -> App<'a, 'a> {
              .value_name("k")
              .help("Lenght of a vector to use for FFM")
              .takes_value(true))
+		.arg(Arg::with_name("ffm_mc_iteration_count")
+			.long("ffm_mc_iteration_count")
+			.help("Number of Monte Carlo iterations to run")
+			.takes_value(true))
+		.arg(Arg::with_name("ffm_mc_dropout_rate")
+			.long("ffm_mc_dropout_rate")
+			.help("Dropout rate for Monte Carlo after FFM")
+			.takes_value(true))
         .arg(Arg::with_name("ffm_bit_precision")
              .long("ffm_bit_precision")
              .value_name("N")