Changes between Version 9 and Version 10 of OperationalMonitoring/DataSchema


Ignore:
Timestamp:
01/21/14 18:01:34 (10 years ago)
Author:
chaos@bbn.com
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • OperationalMonitoring/DataSchema

    v9 v10  
    1414 * config: data which is unlikely to change frequently, but should be polled occasionally in case it has changed
    1515
    16 || '''Subject'''       || '''Metric'''         || '''Type'''  || '''Units''' || '''Description'''                                                                      || '''Use Cases''' ||
    17 || shared compute node || CPU utilization      || measurement || percent     ||                                                                                        || 3               ||
    18 || shared compute node || swap free            || measurement || percent     || percent of total swap which is free                                                    || 3               ||
    19 || shared compute node || memory total         || config      || bytes       || total physical memory on the node                                                      || 3               ||
    20 || shared compute node || memory used          || measurement || bytes       || total memory in active use on the node                                                 || 3               ||
    21 || shared compute node || disk part max used   || measurement || percent     || highest percent utilization of any local partition                                     || 3               ||
    22 || shared compute node || ctrl net max bytes   || config      || integer     || sum of maximum bytes per second available on all control interfaces                    || 3               ||
    23 || shared compute node || ctrl net RX bytes    || measurement || integer     || sum of bytes received on all control interfaces since last reset                       || 3               ||
    24 || shared compute node || ctrl net TX bytes    || measurement || integer     || sum of bytes transmitted on all control interfaces since last reset                    || 3               ||
    25 || shared compute node || ctrl net max packets || config      || integer     || sum of maximum packets per second available on all control interfaces                  || 3               ||
    26 || shared compute node || ctrl net RX packets  || measurement || integer     || sum of packets received on all control interfaces since last reset                     || 3               ||
    27 || shared compute node || ctrl net TX packets  || measurement || integer     || sum of packets transmitted on all control interfaces since last reset                  || 3               ||
    28 || shared compute node || ctrl net RX errs     || measurement || integer     || sum of receive errors on all control interfaces since last reset                       || 3               ||
    29 || shared compute node || ctrl net TX errs     || measurement || integer     || sum of transmit errors on all control interfaces since last reset                      || 3               ||
    30 || shared compute node || ctrl net RX drops    || measurement || integer     || sum of receive drops (how does it know?) on all control interfaces since last reset    || 3               ||
    31 || shared compute node || ctrl net TX drops    || measurement || integer     || sum of transmit drops on all control interfaces since last reset                       || 3               ||
    32 || shared compute node || data net max bytes   || config      || integer     || sum of maximum bytes per second available on all dataplane interfaces                  || 3               ||
    33 || shared compute node || data net RX bytes    || measurement || integer     || sum of bytes received on all dataplane interfaces since last reset                     || 3               ||
    34 || shared compute node || data net TX bytes    || measurement || integer     || sum of bytes transmitted on all dataplane interfaces since last reset                  || 3               ||
    35 || shared compute node || data net max packets || config      || integer     || sum of maximum packets per second available on all dataplane interfaces                || 3               ||
    36 || shared compute node || data net RX packets  || measurement || integer     || sum of packets received on all dataplane interfaces since last reset                   || 3               ||
    37 || shared compute node || data net TX packets  || measurement || integer     || sum of packets transmitted on all dataplane interfaces since last reset                || 3               ||
    38 || shared compute node || data net RX errs     || measurement || integer     || sum of receive errors on all dataplane interfaces since last reset                     || 3               ||
    39 || shared compute node || data net TX errs     || measurement || integer     || sum of transmit errors on all dataplane interfaces since last reset                    || 3               ||
    40 || shared compute node || data net RX drops    || measurement || integer     || sum of receive drops (how does it know?) on all dataplane interfaces since last reset  || 3               ||
    41 || shared compute node || data net TX drops    || measurement || integer     || sum of transmit drops on all dataplane interfaces since last reset                     || 3               ||
    42 || shared compute node || is available         || measurement || boolean     || is the node considered to be online as the result of a simple check at the given time? || 3               ||
    43 || aggregate           || current sliver list  || state       || list        || list of slivers (URN + UUID) currently existing or reserved on the aggregate           || 6               ||
    44 || sliver              || slice URN/UUID       || state       || string      || unique identifier of slice mapped to sliver (URN + UUID)                               || 6               ||
    45 || sliver              || creation time        || state       || timestamp   || creation time of sliver                                                                || 6               ||
    46 || sliver              || expiration time      || state       || timestamp   || current expiration time of sliver                                                      || 6               ||
    47 || sliver              || creator URN          || state       || string      || URN of sliver creator                                                                  || 6               ||
    48 || sliver              || resources            || state       || list        || list of resource URNs on which the sliver has a current reservation                    || 6               ||
    49 || slice               || creator              || state       || string      || URN of slice creator                                                                   || 6               ||
    50 || slice               || participants         || state       || list        || list of experimenters who have privileges on a slice                                   || 6               ||
    51 || experimenter        || email                || state       || string      || contact address for experimenter                                                       || 6               ||
     16|| '''Subject'''       || '''Metric'''           || '''Type'''  || '''Units''' || '''Description'''                                                                      || '''Use Cases''' ||
     17|| shared compute node || CPU utilization        || measurement || percent     ||                                                                                        || 3               ||
     18|| shared compute node || swap free              || measurement || percent     || percent of total swap which is free                                                    || 3               ||
     19|| shared compute node || memory total           || config      || bytes       || total physical memory on the node                                                      || 3               ||
     20|| shared compute node || memory used            || measurement || bytes       || total memory in active use on the node                                                 || 3               ||
     21|| shared compute node || disk part max used     || measurement || percent     || highest percent utilization of any local partition                                     || 3               ||
     22|| shared compute node || ctrl net max bytes     || config      || integer     || sum of maximum bytes per second available on all control interfaces                    || 3               ||
     23|| shared compute node || ctrl net RX bytes      || measurement || integer     || sum of bytes received on all control interfaces since last reset                       || 3               ||
     24|| shared compute node || ctrl net TX bytes      || measurement || integer     || sum of bytes transmitted on all control interfaces since last reset                    || 3               ||
     25|| shared compute node || ctrl net max packets   || config      || integer     || sum of maximum packets per second available on all control interfaces                  || 3               ||
     26|| shared compute node || ctrl net RX packets    || measurement || integer     || sum of packets received on all control interfaces since last reset                     || 3               ||
     27|| shared compute node || ctrl net TX packets    || measurement || integer     || sum of packets transmitted on all control interfaces since last reset                  || 3               ||
     28|| shared compute node || ctrl net RX errs       || measurement || integer     || sum of receive errors on all control interfaces since last reset                       || 3               ||
     29|| shared compute node || ctrl net TX errs       || measurement || integer     || sum of transmit errors on all control interfaces since last reset                      || 3               ||
     30|| shared compute node || ctrl net RX drops      || measurement || integer     || sum of receive drops (how does it know?) on all control interfaces since last reset    || 3               ||
     31|| shared compute node || ctrl net TX drops      || measurement || integer     || sum of transmit drops on all control interfaces since last reset                       || 3               ||
     32|| shared compute node || data net max bytes     || config      || integer     || sum of maximum bytes per second available on all dataplane interfaces                  || 3               ||
     33|| shared compute node || data net RX bytes      || measurement || integer     || sum of bytes received on all dataplane interfaces since last reset                     || 3               ||
     34|| shared compute node || data net TX bytes      || measurement || integer     || sum of bytes transmitted on all dataplane interfaces since last reset                  || 3               ||
     35|| shared compute node || data net max packets   || config      || integer     || sum of maximum packets per second available on all dataplane interfaces                || 3               ||
     36|| shared compute node || data net RX packets    || measurement || integer     || sum of packets received on all dataplane interfaces since last reset                   || 3               ||
     37|| shared compute node || data net TX packets    || measurement || integer     || sum of packets transmitted on all dataplane interfaces since last reset                || 3               ||
     38|| shared compute node || data net RX errs       || measurement || integer     || sum of receive errors on all dataplane interfaces since last reset                     || 3               ||
     39|| shared compute node || data net TX errs       || measurement || integer     || sum of transmit errors on all dataplane interfaces since last reset                    || 3               ||
     40|| shared compute node || data net RX drops      || measurement || integer     || sum of receive drops (how does it know?) on all dataplane interfaces since last reset  || 3               ||
     41|| shared compute node || data net TX drops      || measurement || integer     || sum of transmit drops on all dataplane interfaces since last reset                     || 3               ||
     42|| shared compute node || is available           || measurement || boolean     || is the node considered to be online as the result of a simple check at the given time? || 3               ||
     43|| aggregate           || current sliver list    || state       || list        || list of slivers (URN + UUID) currently existing or reserved on the aggregate           || 6               ||
     44|| sliver              || slice URN/UUID         || state       || string      || unique identifier of slice mapped to sliver (URN + UUID)                               || 6               ||
     45|| sliver              || creation time          || state       || timestamp   || creation time of sliver                                                                || 6               ||
     46|| sliver              || expiration time        || state       || timestamp   || current expiration time of sliver                                                      || 6               ||
     47|| sliver              || creator URN            || state       || string      || URN of sliver creator                                                                  || 6               ||
     48|| sliver              || resources              || state       || list        || list of resource URNs on which the sliver has a current reservation                    || 6               ||
     49|| slice               || creator                || state       || string      || URN of slice creator                                                                   || 6               ||
     50|| slice               || participants           || state       || list        || list of experimenters who have privileges on a slice                                   || 6               ||
     51|| experimenter        || email                  || state       || string      || contact address for experimenter                                                       || 6               ||
     52|| config datastore    || current datastore list || config      || list        || list of local datastores to query for GENI monitoring data                             || 3, 6            ||
     53|| local datastore     || data types             || config      || list        || list of data types which the datastore supports                                        || 3, 6            ||
     54
     55== Data needed to meet all use cases ==
     56
     57We haven't specced out the exact syntax of what information aggregators will get from the config datastore which will tell them what other datastores to query for information.  It will need to include at least the location of each datastore, what data types you can ask that datastore for, and presumably information about what aggregates that datastore supports, etc.  I put in a couple of placeholder items for this at the bottom of the list, but it'll need to be fleshed out.
    5258
    5359== Data needed to meet use case 3 ==