All,<br>We're collecting a fair amount of data and using Cacti to graph it. It's on a really beefy machine with lots of memory and the box just seems to be loping along just fine. The problem is, we're seeing at least an hour delay before graphs are updated and our customers are very unhappy. We're running on a dual, 6-core machine with HT turned on, 48G of memory, and writing RRD data to a gig-attached Netapp. The box is effectively idle:<br>
<br>08:54:31 AM     CPU     %user     %nice   %system   %iowait    %steal     %idle<br>09:01:01 AM     all      0.39      0.00      0.56      3.59      0.00     95.46<br>09:01:31 AM     all      0.89      0.00      2.36      3.72      0.00     93.03<br>
09:02:01 AM     all      0.36      0.00      0.48      3.68      0.00     95.48<br>09:02:31 AM     all      0.35      0.00      0.38      3.78      0.00     95.48<br>09:03:01 AM     all      0.79      0.00      0.47      3.77      0.00     94.97<br>
09:03:31 AM     all      0.36      0.00      0.44      3.84      0.00     95.36<br><br>Where should I start to look to diagnose this? I've written a small script to force a flush and though it succeeds, it appears to have no effect at all. Am I in I/O hell, but just don't know it because I've got so much CPU?<br>
<br>Here's my script:<br><br>#!/usr/bin/perl<br>use Collectd::Unixsock ();<br>#<br>$sock = Collectd::Unixsock->new ();<br>if (!$sock)  {<br>    return;<br> }<br><br>$status = $sock->flush (timeout=>-1);<br>if (!$status)  {<br>
    cluck ("FLUSH failed: " . $sock->{'error'});<br>    $sock->destroy ();<br>    return;<br>}<br>$sock->destroy ();<br><br>Thanks,<br><br>Mark<br>